Як розпізнати підробку

Інтернет, безперечно, створив масу зручностей, але при цьому породив не менша кількість проблем. Одна з них – використання «плагіату» при написанні школярами рефератів, студентами – курсових і дипломних робіт, здобувачами наукових ступенів – дисертацій. На щастя, на будь-який прийом знайдеться контрприйом …
Cодержімое веб-простору стало тією доступною базою даних, кото ¬ раю здатна вбити будь-який творчий порив у ледачого людини і звести його до банального «копіпейста». Дані статистики красномовні: 38% студентів визнаються в постійному плагіаті рефератів, інші роблять це епізодично. Втім, не наша справа перестерігати – своя голова має бути на плечах ...

А от у науковому світі все куди серйозніше. На жаль, і в академічних колах знаходяться подібні «студіозуси», бажаючі здобути собі слави за рахунок праць колег. Механізми пошуку наукових робіт в Інтернеті постійно удосконалюються. Помітний прогрес і в арсеналі прийомів присвоєння чужої інтелектуальної власності: розпізнавання, перекладу, редагування і т. п. Але злодюжки рідко «Піонер» чужі думки відірваними від тексту, яким вони викладені. Це їх і видає.

Якщо реферат представлений в електронному вигляді, то завдання перевірки тексту на плагіат для досвідченого викладача (експерта) не становить великої праці. Досить ввести в пошуковику п’ять-шість ключових слів, обраних з документів «вручну». Ефективним може виявитися пошук по фрагменту тексту, реалізований більшістю пошукових систем – не тільки на веб-сторінках, але й у файлах офісних форматів (DOC, RTF або PDF). У якості «ідентифікаторів» тексту також можуть розглядатися типові помилки.

Документи Microsoft Word можуть містити приховану інформацію – імена творців документів, користувачів, назви організацій, шлях до файлу документа і т. п. Витяг цієї інформації вимагає знання нюансів програмного продукту, однак також може бути аргументом при виявленні клона чужого документа.

Як правило, описаних вище прийомів вистачає для викриття несвідомих учнів. Але іноді потрібно обробити величезну кількість «творінь» або провести експертизу на предмет автоматичного перекладу або машинної правки. Тоді на допомогу приходять просунуті автоматизовані системи розпізнавання плагіату. В якості баз даних для порівняння текстів можна використовувати готові бази даних пошукових систем (Google, Яндекc), які охоче надають API для доступу до своїх ресурсів.

До того ж будь-який текст, написаний певною людиною, характеризується параметрами, властивими саме цій людині. Вони певним чином і «прив’язують» текст до автора, В якості таких параметрів можна розглядати середню довжину слова та пропозиції.

Серед найпростіших інструментів автоматичного пошуку збігів можна назвати колекцію рефератів. Пошук по ній ведеться за допомогою Яндекса. Ця добірка сама по собі є непоганою підмогою як для плагіаторів, так для їх викривачів.

Безкоштовний, доступний в Інтернеті інструмент пошуку плагіату WCopyFind був розроблений професором фізики Лу Блюмфілд в університеті штату Вірджинія. Це нескладна програма, яка аналізує курсову роботу, порівнюючи її з базою даних, яка містить кілька тисяч документів. При цьому вона пов’язує знайдені співпадаючі фрагменти гіперпосиланнями, щоб вказати першоджерело. Ще один безкоштовний інструмент – Соруsсаре. Він призначений для пошуку плагіату на веб-сайтах. Цей сервіс був запущений компаній Indigo Stream Technologies і базується на пошуку Google.

Мабуть, найпопулярнішою з професійних програм пошуку плагіату є система Turnitin, розроблена компанією iParadigms, LLC. Її база даних містить понад 25 ТБ інформації (рефератів, курсових і т. п.). Викладачі можуть заносити в сервер до 1000 файлів за один раз. Система порівнює матеріали зі своєю базою і текстами з «колекцій рефератів», а також з раніше представленими роботами. Сервіс працює на комерційній основі і вимагає попередньої реєстрації.
Для російськомовного контенту найвдалішим виявилося рішення компанії «Анти-Плагіат». Її головна перевага – можливість виявлення плагіату на будь-якій мові.

Концепцій побудови систем боротьби з плагіатом сьогодні безліч – від імовірнісних, лінгвістичних, до психологічних. Найбільший прогрес все ж очікується від використання концепції Text Mining, яка має на увазі побудова механізмів виділення фактів і аномалій, властивих тексту, побудова текстових масивів і т. п.

Правда, на шляху широкого впровадження засобів антиплагіату зустрічаються і проблеми. Наприклад, нещодавно була піддана сумніву правомірність дій служби Turnitin. Після перевірки система включає в свою базу даних роботу студента, отримуючи вигоду без виплати компенсації автору.
Незважаючи на це Об’єднаний комітет з інформаційних систем вузів Великобританії організував на базі Turnitin власний сервіс пошуку.

Слід зазначити, що і в Україні створено кілька програмних комплексів боротьби з плагіатом, зокрема в Українському мовно-інформаційному фонді НАН України і в Національному авіаційному університеті. Разом з тим українські вузи не поспішають впроваджувати ці програми.

Автори одного з таких комплексів стверджують, що це пов’язано і з тим, що сьогодні дипломно-курсовим бізнесом займаються не тільки студенти, а й викладачі. На їх думку, для впровадження «антіплагіаторов» необхідно державне регулювання. Зрештою держава має бути зацікавлена у вирішенні проблеми: адже чим менше студенти будуть списувати – тим більше професіоналів отримає країна.

Comments are closed.