Программа "Антиплагиат"

XXX_Loop_XXX
5/30/2006, 1:14:43 AM
Только что в новостях смотрел про прогу, которая определяет процент "заимствования" из инет рефератов и т.п.
Интересно, а как она работает, т.е. каков принцип действия?
Был на их сайте, но ничего интересующего не нашёл.
tetro
5/30/2006, 3:39:14 PM
Не знаю как это фигня будет работать, но тривиальные заимствования можно вполне на каком-нибудь перле с гуглом сваять...

В цикле на 10к попыток
Вычисляем случайный инкремент из поданного реферата и ищем повторение предложения длиной скажем 10-15 слов подряд в И-те.
Если нашли начинаем сравнивать детально окрестности повторения в оригинальном документе и в тех что нашли...

Другой метод: (приемлем для более специфичных областей) сделать рейтиг повторения слов в реферате и И-те найти те которые в реферате встречаются заметно чаще чем в И-те и для документов с похожей статистикой искать ...
-=Велла=-
5/30/2006, 3:54:42 PM
Таким образом получается, что для работы рограммы нужен Инет? А если нету?
tetro
5/30/2006, 5:15:59 PM
Еще раз - я без понятия о какой программе речь... Я написал пару идей что бы я сделал если бы мне надо было такое сделать ...

2 -=Велла=- : по сути вопроса - я мало верю в возможность пути отличного от поиска источников. (Если передо мной 2 статьи по теме в __которой__ я__ни__бельмеса__ - мне достаточно тяжело решить кто откуда списал). Поэтому кстати есть бизнес по написанию рефератов на заказ.
XXX_Loop_XXX
5/30/2006, 8:49:20 PM
Зайдите Сюда и всё увидите. Интересно как она получает доступ к ресурсам где пароль представлен ввиде картинки?
tetro
5/30/2006, 9:15:24 PM
Давайте, так я регистрироваться у них не буду, а то что есть на титульной странице на человеческий язык не переводится ...
Если вы можете дать ссылки на детальную информацию, то мы о ней поговорим.

Картинку прочитать может не только человек, но и машина если очень надо. Да и обходные пути при случае есть. А куда вам это надо?
XXX_Loop_XXX
5/30/2006, 9:25:56 PM
Вэлла, проверяемый реферат загружается на сайт и потом идёт проверка....
Подобная проверка уже стала обязательной в МГУ и планируется ввести её во всех ВУЗах России.

Просто интересно как она работает, думаю скоро появится нечто такое из ПО, которая будет "обрабатывать" реферат и он будет "правильно" оценён этой прогой. :)
tetro
5/30/2006, 11:22:04 PM
Повторюсь: кроме случаев "примитивного" списывания я не верю в эффективность автоматических систем (и это я говорю как доктор наук в области неслишком далекой области).

С другой стороны: я за пару минут личного чтения реферата в области которую я знаю скажу откуда его скомпилировали...
-=Велла=-
5/30/2006, 11:29:44 PM
Наверное работает по подобию антиспамовских фильтров.. Учится, то есть...
ФИгня все это, препод и сам знает, когда кто-то откуда-то списал... Это по стилю письма видно...
tetro
5/30/2006, 11:38:42 PM
Не может такая фигня учиться ... ибо нет у нее тренера, который скажет что списано а что нет.

Плюс или ее надо тренировать на каждого в отдельности, так как предположим вы ей сунули цельно тянутый реферат (который скажем написал вам знакомый) как он узнает что автор не вы, а тот знакомый.

А если этот знакомый не знакомый, а известный в узких кругах источник.

Что можно попытаться это построить стилистический анализатор текста, но я не слышал о работающих прототипах...
Абвгдейка
6/19/2006, 5:17:58 PM
да фигня это все. у них даже пушкин не входит в документ. хотя задумка интересная))
XXX_Loop_XXX
7/1/2006, 2:21:29 AM
ты проверял?
DELETED
9/18/2006, 5:11:38 AM
По моему, это самый верный вариант связать прогу с любым поисковиком и, соответственно, искать идущие друг за другом слова на повтор. А если эти слова поменять местами или заменить синонимами, то, по моему, прога будет бессильно, что либо сделать.