Программа "Антиплагиат"

XXX_Loop_XXX
Мастер
5/30/2006, 1:14:43 AM
Только что в новостях смотрел про прогу, которая определяет процент "заимствования" из инет рефератов и т.п.
Интересно, а как она работает, т.е. каков принцип действия?
Был на их сайте, но ничего интересующего не нашёл.
Интересно, а как она работает, т.е. каков принцип действия?
Был на их сайте, но ничего интересующего не нашёл.

tetro
Специалист
5/30/2006, 3:39:14 PM
Не знаю как это фигня будет работать, но тривиальные заимствования можно вполне на каком-нибудь перле с гуглом сваять...
В цикле на 10к попыток
Вычисляем случайный инкремент из поданного реферата и ищем повторение предложения длиной скажем 10-15 слов подряд в И-те.
Если нашли начинаем сравнивать детально окрестности повторения в оригинальном документе и в тех что нашли...
Другой метод: (приемлем для более специфичных областей) сделать рейтиг повторения слов в реферате и И-те найти те которые в реферате встречаются заметно чаще чем в И-те и для документов с похожей статистикой искать ...
В цикле на 10к попыток
Вычисляем случайный инкремент из поданного реферата и ищем повторение предложения длиной скажем 10-15 слов подряд в И-те.
Если нашли начинаем сравнивать детально окрестности повторения в оригинальном документе и в тех что нашли...
Другой метод: (приемлем для более специфичных областей) сделать рейтиг повторения слов в реферате и И-те найти те которые в реферате встречаются заметно чаще чем в И-те и для документов с похожей статистикой искать ...

-=Велла=-
Акула пера
5/30/2006, 3:54:42 PM
Таким образом получается, что для работы рограммы нужен Инет? А если нету?

tetro
Специалист
5/30/2006, 5:15:59 PM
Еще раз - я без понятия о какой программе речь... Я написал пару идей что бы я сделал если бы мне надо было такое сделать ...
2 -=Велла=- : по сути вопроса - я мало верю в возможность пути отличного от поиска источников. (Если передо мной 2 статьи по теме в __которой__ я__ни__бельмеса__ - мне достаточно тяжело решить кто откуда списал). Поэтому кстати есть бизнес по написанию рефератов на заказ.
2 -=Велла=- : по сути вопроса - я мало верю в возможность пути отличного от поиска источников. (Если передо мной 2 статьи по теме в __которой__ я__ни__бельмеса__ - мне достаточно тяжело решить кто откуда списал). Поэтому кстати есть бизнес по написанию рефератов на заказ.

XXX_Loop_XXX
Мастер
5/30/2006, 8:49:20 PM
Зайдите Сюда и всё увидите. Интересно как она получает доступ к ресурсам где пароль представлен ввиде картинки?

tetro
Специалист
5/30/2006, 9:15:24 PM
Давайте, так я регистрироваться у них не буду, а то что есть на титульной странице на человеческий язык не переводится ...
Если вы можете дать ссылки на детальную информацию, то мы о ней поговорим.
Картинку прочитать может не только человек, но и машина если очень надо. Да и обходные пути при случае есть. А куда вам это надо?
Если вы можете дать ссылки на детальную информацию, то мы о ней поговорим.
Картинку прочитать может не только человек, но и машина если очень надо. Да и обходные пути при случае есть. А куда вам это надо?

XXX_Loop_XXX
Мастер
5/30/2006, 9:25:56 PM
Вэлла, проверяемый реферат загружается на сайт и потом идёт проверка....
Подобная проверка уже стала обязательной в МГУ и планируется ввести её во всех ВУЗах России.
Просто интересно как она работает, думаю скоро появится нечто такое из ПО, которая будет "обрабатывать" реферат и он будет "правильно" оценён этой прогой. :)
Подобная проверка уже стала обязательной в МГУ и планируется ввести её во всех ВУЗах России.
Просто интересно как она работает, думаю скоро появится нечто такое из ПО, которая будет "обрабатывать" реферат и он будет "правильно" оценён этой прогой. :)

tetro
Специалист
5/30/2006, 11:22:04 PM
Повторюсь: кроме случаев "примитивного" списывания я не верю в эффективность автоматических систем (и это я говорю как доктор наук в области неслишком далекой области).
С другой стороны: я за пару минут личного чтения реферата в области которую я знаю скажу откуда его скомпилировали...
С другой стороны: я за пару минут личного чтения реферата в области которую я знаю скажу откуда его скомпилировали...

-=Велла=-
Акула пера
5/30/2006, 11:29:44 PM
Наверное работает по подобию антиспамовских фильтров.. Учится, то есть...
ФИгня все это, препод и сам знает, когда кто-то откуда-то списал... Это по стилю письма видно...
ФИгня все это, препод и сам знает, когда кто-то откуда-то списал... Это по стилю письма видно...

tetro
Специалист
5/30/2006, 11:38:42 PM
Не может такая фигня учиться ... ибо нет у нее тренера, который скажет что списано а что нет.
Плюс или ее надо тренировать на каждого в отдельности, так как предположим вы ей сунули цельно тянутый реферат (который скажем написал вам знакомый) как он узнает что автор не вы, а тот знакомый.
А если этот знакомый не знакомый, а известный в узких кругах источник.
Что можно попытаться это построить стилистический анализатор текста, но я не слышал о работающих прототипах...
Плюс или ее надо тренировать на каждого в отдельности, так как предположим вы ей сунули цельно тянутый реферат (который скажем написал вам знакомый) как он узнает что автор не вы, а тот знакомый.
А если этот знакомый не знакомый, а известный в узких кругах источник.
Что можно попытаться это построить стилистический анализатор текста, но я не слышал о работающих прототипах...

Абвгдейка
Мастер
6/19/2006, 5:17:58 PM
да фигня это все. у них даже пушкин не входит в документ. хотя задумка интересная))

XXX_Loop_XXX
Мастер
7/1/2006, 2:21:29 AM
ты проверял?

DELETED
Акула пера
9/18/2006, 5:11:38 AM
По моему, это самый верный вариант связать прогу с любым поисковиком и, соответственно, искать идущие друг за другом слова на повтор. А если эти слова поменять местами или заменить синонимами, то, по моему, прога будет бессильно, что либо сделать.