Распространенные приемы проверки уникальности

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
Сейчас мы рассмотрим варианты проверки большого объема текста на уникальность.

- Из предложений убирают предлоги, знаки препинания, союзы и другие слова, не несущие напрямую смысловой нагрузки, это называется канонизация текста.

- Текст разбивают на шинглы (отрезки текста длиной 5-7 слов) и проверяется внахлест с возможным дубликатом, так используют шинглы.

- Использовав сами шинглы в качестве поисковых запросов вы проведете простое сравнение.

- Не стоит опускаться ниже 80% по уникальности текста.

При том количестве информации, которой пестрит инет, всегда можно сделать сборную солянку из разных источников и получить очень оригинальный текст, к которому ПС не смогут придраться.
 

VyacheslavH

Пользователь
Регистрация
23.06.11
Сообщения
935
Реакции
325
Баллы
28
Возраст
62
Адрес
Черкассы
И в результате этой драки становится очень сложно найти в сети свежую и незаезженную мысль. Разве что на форумах с высоким уровнем троллинга :D
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
VyacheslavH, а что ты хотел, издержки производства :D.

Добавлено через 6 минут
VyacheslavH, а ты не ищи свежие мысли, ты свои генерируй ;)
 

VyacheslavH

Пользователь
Регистрация
23.06.11
Сообщения
935
Реакции
325
Баллы
28
Возраст
62
Адрес
Черкассы
Helenka, та не вопрос :D Я когда пишу, у меня исключительно своё. Но когда читаю других, хочется получать кайф, а не лечить дажавю :crazy:
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
VyacheslavH, ну, ищите первоисточник мысли :pardon:. Не всем нравятся оригинальные идеи. :crazy:
 

VyacheslavH

Пользователь
Регистрация
23.06.11
Сообщения
935
Реакции
325
Баллы
28
Возраст
62
Адрес
Черкассы
VyacheslavH, ну, ищите первоисточник мысли :pardon:.
В первоисточнике информации бывает недостаточно. А когда ищешь есчо, находишь пошарпаный копипаст :D Свои мысли искать нонешний народ ленив есть :D
 

nayturs

Пользователь
Регистрация
20.07.12
Сообщения
130
Реакции
7
Баллы
13
Адрес
СПб
А есть какие-нибудь программы, позволяющие сравнивать два или более конкретных текста на предмет уникальности каждого?
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
nayturs, не поняла вопроса. Опубликованные в инете тексты или написанные вами и хотите сравнить, насколько они отличаются?
 

nayturs

Пользователь
Регистрация
20.07.12
Сообщения
130
Реакции
7
Баллы
13
Адрес
СПб
Не опубликованные в интернете.
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28

nayturs

Пользователь
Регистрация
20.07.12
Сообщения
130
Реакции
7
Баллы
13
Адрес
СПб

Wmboard

Пользователь
Регистрация
01.01.70
Сообщения
9.274
Реакции
2.665
Баллы
28
Адрес
На wmboard
А есть какие-нибудь программы, позволяющие сравнивать два или более конкретных текста на предмет уникальности каждого?

Есть программа, которая видит отличия двух загруженных текстов. Стоп слова, шинглы и прочие штучки. Посмотрю, если осталась - выложу.
 

nayturs

Пользователь
Регистрация
20.07.12
Сообщения
130
Реакции
7
Баллы
13
Адрес
СПб
Есть программа, которая видит отличия двух загруженных текстов. Стоп слова, шинглы и прочие штучки. Посмотрю, если осталась - выложу.

Заранее благодарю:)
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
nayturs, подождем, что Ветер выложит, у меня пока такой надобности не возникало.
 

Wmboard

Пользователь
Регистрация
01.01.70
Сообщения
9.274
Реакции
2.665
Баллы
28
Адрес
На wmboard
Наверное не сегодня... трудный день
 

SpyroSpirit

Пользователь
Регистрация
15.08.12
Сообщения
75
Реакции
19
Баллы
3
Хочется чего-то ещё, онлайновые программы обычно не слишком точные.
Как вариант, утилита Advego Plagiatus. Вбиваешь адрес сайта-источника, ниже текст, проверяешь и смотришь проценты уникальности текста (там же можно отыскать "недобросовестных заимствователей" контента :))
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
Как вариант, утилита Advego Plagiatus. Вбиваешь адрес сайта-источника, ниже текст, проверяешь и смотришь проценты уникальности текста (там же можно отыскать "недобросовестных заимствователей" контента :))

Нет, Адвего работает только с одним текстом и ищет его клонов в сети. Тут же нужно сравнить два текста, которые еще не выложены в инет.
 

SpyroSpirit

Пользователь
Регистрация
15.08.12
Сообщения
75
Реакции
19
Баллы
3
Тут же нужно сравнить два текста, которые еще не выложены в инет.
Это актуально, как я понимаю, только для тех, кто переписывает один и тот же смысл другими словами?(рерайтеры/копирайтеры, не помню кто из них)
Для генераторов контента или тех, кто переводит тексты с английского на русский, нет надобности сравнивать 2 текста. Или я не прав?
 

Helenka1

Пользователь
Регистрация
26.06.12
Сообщения
2.501
Реакции
535
Баллы
28
SpyroSpirit, ты прав только отчасти. Но если хозяин сайта заказывает рерайт (это как раз переписывание текста своими словами), то ему нужно убедиться, что уникальность предоставленной работы высока. Это как раз и даст проверка двух текстов. Либо когда нужно сделать несколько текстов с одного исходника, вот тебе еще один вариант, когда нужно сравнить неопубликованные статьи.

[ADMIN="Veter"]Линукс перемещен https://lumtu.com/operacionnaya-sistema/1307-linux-ili-windows-5.html[/ADMIN]
 
Последнее редактирование модератором:

Статистика форума

Темы
200.483
Сообщения
380.310
Пользователи
327.890
Новый пользователь
рикитики
Сверху Снизу