Пишем анализатор текстовой информации


Содержание

Анализатор текста

Введите свой текст в представленное ниже поле и нажмите кнопку «Анализировать».

Подробная статистика текста. Помимо общих количественных характеристик можно узнать также средние значения, водность текста, часто встречаемые последовательности слов и частотный словарь.

Результирующие таблицы со статистикой

Символы
Общее количество:
Без пробелов:
Слова
Общее количество:
Уникальных слов:
Средняя длина слова: 0 симв.
Кол-во стоп-слов:
Водность текста: ? 0 %
Предложения
Общее количество:
Минимальная длина: 0 слов
Максимальная длина: 0 слов
Средняя длина: 0 слов
Запятые
Общее количество:
Среднее число: 0 на предл.
Частотный словарь
Последовательности слов

© 2013 — Анализатор текста TextAnalyzer / Devaka

Сервисы, которые сделают твой текст читаемым

В эпоху, когда писать и иметь свою аудиторию при желании может любой человек, выделиться сложно. Излагать мысли емко и чётко, как Довлатов, или красиво и захватывающе, как Стивен Кинг, хотят все. В наше время «вода» в тексте может начисто отбить желание его прочесть. Ты должен писать либо интересно, либо полезно. В противном случае исход ясен: результат твоего труда никому не будет нужен.
Поэтому нужно либо оттачивать своё мастерство, либо походить на литературные курсы, либо воспользоваться самым простым методом – проверить свой текст на сервисах и программах, которые оценят твою писанину по шкале «читаемости». Но помни, что они не научат тебя писать, как Маркес. Так что если не умеешь, никто не поможет, засунь свою «писню» куда подальше и не смущай ей даже компьютерный интеллект.

Hemingway

Один из таких инструментов, который, как мне кажется, является самым популярным, – Hemingway. Он назван в честь писателя, который славился лаконичностью и простотой стиля письма. А его задача – помочь другим писателям достичь того же. Hemingway определяет сложность каждого предложения для читателя и подсказывает, какие из них стоит упростить. Делается это исходя из количества слов, частоты использования пассивного залога и глаголов.
В режиме Write с экрана убираются все элементы, поэтому писать становится очень комфортно.
Веб-версия сервиса бесплатна, а текстовый редактор для PC и OS X стоит 9,99 доллара.
hemingwayapp.com

Test-the-Text

Создан для проверки текста в информационном стиле, например, для новостей. Но если ты хочешь сделать свой собственный стиль более лаконичным и избавиться от лишних слов, то этот сервис также пригодится. Он привлечет твое внимание к так называемым стоп-словам: отглагольным существительным, повторам, модальным глаголам, пассивным оборотам, канцеляризмам и клише, – а также предложит, чем их можно заменить. Правда, инструмент работает только с русским языком. Но в общем-то в этом нет ничего плохого.
test-the-text.ru

Readability

С помощью пяти индексов читабельности Readability поможет вычислить, насколько твоя писанина понятна читателям, и на какую аудиторию она рассчитана. Тем не менее, иногда результаты сервиса выглядят несколько сомнительными, например, «Критика чистого разума» Иммануила Канта, по версии Readability, вполне доступна для понимания молодым людям 17-19 лет.
Readability. io

Istio

Сервис, который умеет анализировать текст по многим параметрам и искать орфографические ошибки, а главное, высушивать «воду» из текста. Слова-паразиты, вводные фразы, шаблонные обороты – все это «вода». Некоторое ее количество есть в любом тексте, и само по себе это не является проблемой, но до определенного порога. Оптимальным считается показатель водности менее 30%, максимальный предел – 60%.
Но из всех программ и сервисов Istio вызывает больше всего споров. Если остальные программы говорили, что текст нормальный, то Istio нещадно гнобил работу.
istio.com

Text.ru

Сервис проверки текстов по многим параметрам, включая уникальность, проверку орфографии, выделение ключевых слов. Нас интересует функция анализа водности и спамности (частоты употребления определенного слова или фразы).

Ну, что сказать, сервис дает развернутый анализ текста, выделяет часто употребляемые слова отдельно и в группы. По клику на кнопке «Подробнее» под результатами соответствующих проверок выделяет цветом те фрагменты в тексте, которые считает проблемными. По клику на «?» предоставляет подробные определения каждого параметра в целом и относительно данного текста в частности. Это всё плюсы. Но какой же он долгий… Очень старается проверять орфографию, но у него это, мягко говоря, получается отвратительно. Так что придётся держать при себе словарь и учебник русского языка.
text.ru

Glvrd

Сервис проверки качества контента. Находит в текстах канцеляризмы (конструкты и словосочетания, характерные для официально-делового стиля, но не для литературной речи), выделяет «воду», отмечает перебор запятых и другие «некрасивости».

Главный его плюс – выдаёт очень скрупулезный анализ. Сервис подчеркивает фрагменты, которые, по его мнению, нуждаются в корректировке. По клику на слове дает обоснование, почему считает оборот неудачным, предлагает варианты замены и заметки на близкие темы, что является большой редкостью для подобных сервисов.
glvrd.ru

Данная программа анализирует, насколько чувственно и эмоционально написан твой текст. Только на русском и украинском языке. Это не онлайн-сервис, а скачиваемая программа. После проверки через нее твой тест получит штампы «медлительного», «эмоционального» и даже «тихого». Довольно забавно. Кстати, программа может автоматически оценивать текст прямо во время его написания в Word.
Однако и она не совершенна. Не указывается, какие именно слова или обороты влияют на эмоциональную окраску текста, поэтому непонятно, что делать с полученной информацией. Переписывать бесконечно тоже не выход.
vaal.ru

Quittance

Сервис проверки стилистики текста. Определяет наличие тавтологий (необоснованных повторений, тождественных смысловых конструктов) и близко расположенных слов, сходных по смыслу или имеющих похожее звучание. Очень полезная возможность, если тебе надо добиться максимального благозвучия текста. Помогает «причесать» текст после долгой работы над ним, когда глаз «замыливается». Пускай он выглядит скучно, пускай с некоторыми его решениями можно поспорить, главное, что он выполняет свою работу.
quittance.ru

Textmarket

Водность – это слова и обороты, которые не несут информационной нагрузки. «Тошнота» – это не желание выплеснуть наружу содержимое желудка, а частота слов или фраз, употребляемых в тексте. И задача Textmarket – выявлять это.

Компьютерная лингвистика и анализ текста

Компьютерный анализ текста на естественном языке активно развивается в последние годы многими коллективами. Доступные сегодня вычислительные мощности позволяют применять для обработки больших массивов документов широкий класс математических методов, способствующих эффективному решению задач поиска, классификации, кластерного анализа, выявления скрытых закономерностей в данных и др. С иллюстрацией подобных приложений можно познакомиться, к примеру, на сайте http://research.metric.ru.

К сожалению, внедрение математических методов в обработку текста происходит в то время, когда собственно лингвистическая составляющая алгоритмов представлена явно недостаточно, и это не позволяет достичь высокого качества работы прикладных систем. Устойчивый уклон в область статистических методов анализа привел к тому, что компьютерная лингвистика оказалась невостребованной. В самом деле, во всех известных русскоязычных системах подобного класса из лингвистического обеспечения используется лишь морфологический словарь, позволяющий отождествлять различные словоформы, тогда как алгоритмы синтаксического анализа реализованы исключительно в автоматических переводчиках и вызывают множество нареканий в связи с невысокой точностью.

Поговорим о проблемах компьютерной лингвистики, касающихся прежде всего грамматического разбора текста на естественном языке. При этом оставим за рамками статьи специфические вопросы, связанные с машинным переводом, и, опираясь на личный опыт разработки информационно-поисковых систем (ИПС) в компании «Гарант-Парк-Интернет», рассмотрим перспективы применения лингвистики в контексте таких систем. Создание качественного синтаксического анализатора позволяет надеяться на эффективное решение задачи поиска в информации на естественном языке.

Сложность практической реализации приемлемого анализатора текста обусловлена наличием тесной связи между синтаксисом и надъязыковой семантикой. Так, в синтаксически эквивалентных фразах «человек стрелял из ружья» и «человек стрелял из окна» «ружье» представляет аргумент глагола-предиката «стрелять» в роли косвенного дополнения, а объект «окно» — обстоятельство места, являющееся дополнительной характеристикой всей ситуации в целом. Для решения подобных проблем (называемых синтаксической омонимией) необходимо создание специального толково-комбинаторного словаря, включающего в себя синтаксическую и семантическую информацию о сочетаемости слов. При этом он, с одной стороны, должен декларировать, что аргумент предиката «стрелять», представляющий орудие действия, относится к классу «оружие», а с другой — установить все слова, относимые к этому классу: «ружье», «рогатка» и др.

Формально целью синтаксического разбора является построение дерева зависимостей между словами во фразе. В случае удачи предложение сворачивается в полносвязное дерево с единственной корневой вершиной. Поскольку одна словоформа может соответствовать нескольким грамматическим формам слова, в том числе для различных слов (например, «стали» у существительного «сталь» и глагола «стать»), в ходе анализа необходимо производить свертку предложения для всех возможных вариантов. Те же из них, которые приводят к максимальной свертке фразы (с минимальным числом висячих вершин), предлагается считать наиболее достоверными при разборе предложения.

Порядок применения правил разбора управляется его алгоритмом, который на каждом шаге проверяет возможность применения следующего правила к очередному фрагменту фразы (двум-трем словам, знакам препинания и т. п.). В случае удачи фрагмент сворачивается. Обычно это приводит к его замене одним главным словом, т. е. удалением подчиненных слов. После чего разбор продолжается. Если дальнейшее применение правил невозможно, на любом из шагов совершается откат. При этом последний свернутый фрагмент восстанавливается, и предпринимается попытка применить другие правила. Окончательным вариантом разбора следует считать такую последовательность применения правил, которая приводит к максимальной свертке предложения.

Так, в ходе разбора фразы «усталые гуси и утки стали снижаться», возникают следующие варианты:

(усталые -> гуси + утки ) )

> (стали (усталые -> гуси ) и (утки

> стали ((усталые -> гуси ) + (утки (мастерами (символами (поколений (поколений

Такое представление позволяет решать задачу фактографического поиска, например: «найти всех персон, контактировавших с организацией X определенным образом». То есть выявить все одушевленные именные группы, связанные с X посредством заданных глаголов в соответствующей синтаксической роли.

Связи, возникающие между строками таблиц при совпадении значений полей, порождают семантическую сеть на множестве целевой коллекции анализируемых документов. Причем связи эти дифференцированы по типам, что позволяет искать ответы на сложные вопросы следующего вида: «Найти всех арендодателей в Москве, у которых арендаторы торгуют маслом». Соответствующий запрос к базе данных на языке SQL будет выглядеть так:

SELECT Агенс FROM Арендовать WHERE Обстоятельство = «Москва» AND Бенефактив IN (SELECT Агенс FROM Торговать WHERE Пациенс = «масло»)

Аналогичным образом вопрос на естественном языке может быть преобразован в стандартный запрос к базе данных на SQL. При этом глагол определяет имя таблицы, в которой ведется поиск, заданные в вопросе аргументы глагола представляют поисковые ограничения на значения полей в таблице, а вопросительное слово («что, где, сколько») указывает, в каком столбце вести поиск.

Вершиной компьютерного анализа текста является автоматическое реферирование. Наличие семантической сети понятий, соединенных глаголами, позволяет сформулировать основные идеи текста документа, отраженные в часто встречающихся понятиях и связях, в виде простых предложений, например:

Клинки изготавливаются японскими мастерами. Запрещен вывоз старинных клинков. Технология производства известна. Русские мастера воспроизводят клинки. Клинки продаются.

Словарь моделей управления и семантической сети с дифференцированными связями значительно облегчает подобный синтез. Отдельной проблемой является выбор оптимального порядка фраз. Возможно, при этом будет полезно знание коммуникативной структуры текста — иерархии тем и рем, которая отражает логику изложения автором материала.

Задача тема-рематического анализа решается в ходе синтаксического разбора фразы: понятия из группы подлежащего представляют темы; понятия-дополнения глагола — ремы, которые могут стать темами последующих фраз; обстоятельства — лишь некий фон, на котором развертываются описываемые события.

Общая схема подобного анализа текста приведена на рисунке.

Проверка творчества: 10 сервисов для оценки качества текстов Материал редакции

Наталья Воскобойникова, руководитель контент-студии WordFactory, написала для ЦП колонку с обзором сервисов для автоматической проверки текстов.

Один из главных трендов в сфере контент-менеджмента последних лет — автоматизация всего: и процесса работы копирайтера, и ее проверки, и даже корректирования результатов его работы.

Мы выбрали 10 сервисов. Взяли свой текст, который порадовал нас во всех отношениях (посещаемость, переходы, количество обращений, продажи), и проверили его в каждой из систем.

Результаты были лестными: нашу заметку признали качественной по ряду параметров: водность, читабельность, спамность.

Были и казусы: один из сервисов посчитал, что наш текст — это и не текст вовсе, а просто набор букв, а другой, что он слишком «водянистый», «заспамленный». Хотя читателей и наших новых клиентов, полученных благодаря этому тексту, подача информации вполне устроила.

Впрочем, обо всем по порядку.

Бета-версия анализатора качества контента. Анализ проводится на базе закона Ципфа, то есть качество текста в данном случае определяется на основании соответствия частоты употребления слов в естественной речи и тексте.

Результат выдается в двух окнах: в одном — график, в другом — частота использования отдельных слов и рекомендации по корректировке.

Скриншоты проверки текста:

Сервис оценил качество нашего текста на «удовлетворительно» и указал, какие слова, по его мнению, встречаются чаще, чем следует.

Что хорошо? Быстро, удобно, наглядно.

Что плохо? Сервис не умеет анализировать тексты длиннее 5 тысяч слов.

Непонятно, что такое эти «читательа» и прочие странные вещи, которые сервис считает синонимами употребленных в тексте слов. Впрочем, мы помним, что перед нами — бета-версия.

pr-cy.ru

Еще один анализатор текста по закону Ципфа с рекомендациями по коррекции частоты встречающихся слов. То есть принцип оценки — тот же, что у предыдущего сервиса.

Скриншот результата проверки текста:

Этот сервис счел, что предложенный для анализа текст выглядит естественно, и высоко оценил его качество.

Что хорошо? Очень наглядно, удобно, с таблицей соответствия и рекомендациями. Есть возможность анализировать текст со страницы сайта, просто указывая ссылку.

Предельный объем текста — 15 тысяч слов. Анализирует также тошноту текста.

Что плохо? Ничего плохого не замечено. Но мы видим, что этот анализатор дал нашему тексту более высокую оценку по сравнению с предыдущим. Может быть, он нам льстит?

istio.com

Сервис, который умеет анализировать текст по многим параметрам и искать орфографические ошибки. Нас будет интересовать функция проверки водности, то есть слов, которые не несут полезной информации.

Слова-паразиты, вводные фразы, шаблонные обороты — все это «вода». Некоторое ее количество есть в любом тексте, и само по себе это не является проблемой, но до определенного порога. Оптимальным считается показатель водности менее 30%, максимальный предел — 60%.

Скриншоты результата проверки текста:

На первом скриншоте мы видим выделенные слова и фразы, которые сервис назвал «водой», и нельзя сказать, что ход его мыслей всегда очевиден.

А на втором скриншоте, где анализатор собрал совокупные данные по тексту, мы видим, что его водность определена в 44%. Это достаточно много, то есть наш текст, по результатам этого анализа, нуждается в существенной корректировке.

Что хорошо? Удобно и быстро. Вставляем текст, выбираем нужный параметр анализа, получаем результат. Не нужно вставлять текст всякий раз заново, если нужно проанализировать разные параметры.

Заодно с водностью сервис анализирует тошноту, показывает наиболее часто используемые слова, адекватно определяет тематику текста.

Что плохо? Нам трудно поверить, что в тексте действительно 44% воды. Мы, скорее, склонны усомниться в адекватности алгоритмов работы сервиса. Тем более что все прочие сервисы показали водность в два-три раза ниже.

textmarket.net

Сервис проверки водности и тошноты со встроенным текстовым редактором. Мы помним, что водность — это слова и обороты, которые не несут информационной нагрузки. А тошнота — это частота слов или фраз, употребляемых в тексте.

На уровень тошноты влияют и ключевые фразы, используемые в тексте для поисковой оптимизации, и любые другие повторяющиеся слова. По уровню тошноты судят о «натуральности» текста и уровне его оптимизации под поисковые запросы. Максимально допустимый коэффициент тошноты текста «для людей» — 7%, оптимальный — 4–6%.

Скриншот результата проверки текста:

Этот сервис полагает, что уровень «воды» в нашем тексте – вполне допустимый, а вот показатель тошноты — на верхнем пределе. Тут же нам показали первую пятерку наиболее употребляемых слов — сразу понятно, над чем нужно поработать, если мы хотим снизить этот показатель.


Что хорошо? На странице с анализатором даются развернутые объяснения понятий водности и тошноты текста и советы по трактовке полученных цифр.

В анализаторе можно включить текстовый редактор с богатой функциональностью, так что можно заниматься редактированием и прочей работой над тестом, не покидая страницы. Размер поля ввода можно регулировать.

Предоставляет информацию о количестве символов в тексте и пяти наиболее используемых словах.

Что плохо? Нет предметных рекомендаций по корректировке водности конкретного текста.

text.ru

Сервис проверки текстов по многим параметрам, включая уникальность, проверку орфографии, выделение ключевых слов. Нас интересует функция анализа водности и спамности (частоты употребления определенного слова или фразы).

Скриншоты результата проверки текста:

Этот сервис считает, что «воды» в нашем примере мало. А вот слово «уникальность» (его анализатор выделил самым темным цветом) мы повторяем слишком часто, поэтому здесь получился высокий процент заспамленности текста.

Также сервис полагает, что можно пореже использовать и другие слова, которые он выделил более светлой заливкой: «техническая», «смысловая», «текст». Так что, если мы хотим снизить показатель спамности, сервис рекомендует заменить эти слова синонимами или вовсе от них избавиться, поработав над формулировками.

Что хорошо? Дает развернутый анализ текста, выделяет часто употребляемые слова отдельно и в группы. По клику на кнопках «Подробнее» под результатами соответствующих проверок выделяет цветом те фрагменты в тексте, которые считает проблемными.

По клику на «?» предоставляет подробные определения каждого параметра в целом и относительно данного текста в частности.

Что плохо? «Думает» довольно долго. Намного дольше всех предыдущих сервисов.

Попутно с водностью и спамностью он по собственной инициативе проверяет орфографию, и это у него получается плохо – авторам определенно нужно позаботиться о пополнении словаря сервиса (стопорится на словах «инфографика», «Интернет-маркетинг» и так далее)

contentmonster.ru

Сервис, осуществляющий поиск стоп-слов и подсчет их процентного соотношения к общей длине текста. Стоп-слова — это всё то, что не несет самостоятельной смысловой нагрузки, но без чего не бывает связных текстов: предлоги, частицы, междометия, причастия, союзы, а также некоторые наречия, существительные и глаголы.

Слишком большое количество таких слов затрудняет восприятие текста и увеличивает его водность.

Скриншот результата проверки текста:

Сервис выделил только несколько вводных слов и определил общее их количество в 1% с хвостиком, то есть счел, что в этом смысле у нашего текста проблем нет.

Что хорошо? Информативно и просто, по результатам проверки сервис показывает общий процент стоп-слов и подсвечивает их.

Что плохо? Предельный объем текста — 10 тысяч символов.

test-the-text.ru

Сервис проверки текстов, написанных в информационном стиле, главными характеристиками которого являются четкость, предметность, объективность, лаконичность. Тексты, написанные в этом стиле, должны нести полезную информацию и легко читаться.

При помощи данного сервиса тексты проверяются на соответствие информационному стилю, а в качестве бонуса даются рекомендации по корректировке.

Скриншот результата проверки текста:

Сервис уверен, что наш пример не имеет отношения к информационным текстам, определив его качество в 0%. Также он выделил большое количество стоп-слов, не обойдя вниманием наречия и усиливающие определения.

Что хорошо? При клике на подсвеченных словах даются пояснения: что именно в этом фрагменте выглядит спорным, как можно перефразировать оборот, усилить аргументацию, конкретизировать «слабые» места.

Попутно с анализом качества сервис подсчитывает и выделяет стоп-слова, причем очень придирчиво, с запасом.

Что плохо? Нет возможности выделить отдельно стоп-слова. Раз уж сервис умеет их подсчитывать, почему бы не добавить функцию их просмотра отдельным списком?

Качество текста – 0%? Тут явно что-то не так! Может быть, у нас не лучший в мире информационный текст, но этот сервис считает, что он вообще не информационный и не текст.

glvrd.ru

Сервис проверки качества контента. Находит в текстах канцеляризмы (конструкты и словосочетания, характерные для официально-делового стиля, но не для литературной речи), выделяет «воду», отмечает перебор запятых и другие «некрасивости».

Скриншот результата проверки текста:

Никаких оценок сервис не дает, он лишь указывает на неудачные, с его точки зрения, обороты. Впрочем, он и называется сервисом проверки, а не оценки. Поэтому мы не поняли, понравился ему наш текст или нет. Зато хорошо поняли, как можно его улучшить.

Что хорошо? Очень скрупулезный анализ. Сервис подчеркивает фрагменты, которые, по его мнению, нуждаются в корректировке. По клику на слове дает обоснование, почему считает оборот неудачным, предлагает варианты замены и заметки на близкие темы.

Что плохо? Сама специфика такого анализа не предполагает «цифровых» выражений качества текста, но все-таки их не хватает. Иначе после работы над текстом не с чем сравнить получившийся вариант.

vaal.ru

Анализатор эмоциональности текста, написанного на русском или украинском языке. Это не онлайн-сервис, а скачиваемая программа.

Скриншот результата проверки текста:

Все в мире относительно. Мы постарались принять как комплимент оценку «тихий и медлительный», а «нежный» нам даже понравился. Но все-таки, кажется, анализатор хочет сказать, что предложенный пример не способен вдохновлять на подвиги.

Что хорошо? Любопытна сама возможность анализа эмоциональности текста. Есть возможность скачать библиотеку .dll, с которой можно будет оценивать тексты прямо в MS Word.

Что плохо? Нет онлайн-версии. Не указывается, какие именно слова или обороты влияют на эмоциональную окраску текста, поэтому непонятно, что делать с полученной информацией.

quittance.ru

Сервис проверки стилистики текста. Определяет наличие тавтологий (необоснованных повторений, тождественных смысловых конструктов) и близко расположенных слов, сходных по смыслу или имеющих похожее звучание.

Скриншот результата проверки текста:

Опять же, тут нет никаких оценок, только указание на проблемные места. Мы их увидели, как и то, что их немного. Чему и порадовались, сочтя испытание благополучно пройденным.

Что хорошо? Очень полезная возможность, если вам надо добиться максимального благозвучия текста. Помогает «причесать» текст после долгой работы над ним, когда глаз «замыливается».

Что плохо? Не всегда очевидно, какие из подсвеченных слов коррелируют между собой. Нет возможности растянуть поле ввода и увидеть весь текст без скроллинга.

Мораль

Выше было много справедливой критики. Мы увидели, как некоторые программы в пух и прах раскритиковали текст, который принес отличный результат.

Некоторые сервисы уже хорошо справляются с проверкой орфографии и пунктуации и даже пытаются анализировать стилистику. Кто знает, возможно, в обозримом будущем они сделают работу копирайтеров проще, а оценку их труда — гораздо точнее.

Чтобы написать колонку для ЦП, ознакомьтесь с требованиями к публикуемым материалам.

Пишем анализатор текстовой информации

Это модуль, который позволяет проанализировать текущую оптимизацию страницы и подсказывает оптимальное количество вхождений. Анализ проводится на базе топ-10 Яндекса, умеет анализировать оптимизацию страницы сразу по нескольким запросам.

Зачем нужно?

  • Проанализировать качество оптимизации своей страницы.
  • Понять правильную (с точки зрения поиска) структуру документа.
  • Сформировать ТЗ на оптимизацию (Текст, тайтл, и.т.д.)

Что нужно для запуска:

  • Файлик со списком запросов. Скачать пример входного файла: ТЫЦ
  • Код региона, по которому проводить анализ (По умолчанию 213 — Москва)
  • Чекбокс «Соответствие по типу страниц» (по умолчанию выключеноключено)
  • Чекбокс «Анализировать только пересечения» (по умолчанию выключено)
  • Стоп-лист сайтов (до 10 строк, по умолчанию там яндекс и википедия)

Альтернатива загрузки через файл — форма ниже. В ней можно задать проверку одного урла и списка запросов к нему. Подаётся файл с запросами ИЛИ форма.

Подробнее о входных данных:

Список запросов (в форме или *.xlsx файлом).

Обычный файл формата *.xlsx В файле должно быть два столбца. В первом столбце — URL, во втором — запрос, этому урлу соответстующий (не перепутайте столбцы местами!). В запросах должны быть только печатные символы (русские/английские буквы (+белорусские и украинские), цифры, пробел, дефис, «/»). Дубликаты система удалит самостоятельно при нахождении.

Внимание! Система принимает до 10 запросов (включительно) на одну страницу. Если на какую-либо страницу в файле будет больше 10ти, будут рассмотрены только первые десять. При распределении запросов по страницам рекомендуем вам использовать наш кластеризатор.

Скачать пример входного файла (бесплатно, без смс и регистрации) === ТЫЦ

Код региона, согласно таблице кодов Яндекса.

По умолчанию 213 — Москва. Если вы продвигаете региональный сайт, необходимо ввести соответствующий ему в Яндексе код.

Чекбокс «Соответствие по типу страниц»

Если выключен — анализируются все страницы. Если включен — только соответствующие вашей по типу (главная/внутренняя). Т.е. если вы анализируете главную, то из топа для анализа будут браться только главные. По умолчанию — выключен.

Чекбокс «Анализировать только пересечения»

Если включен — анализурются только те урлы, которые находятся в топ-10 Яндекса по всем указанным для страницы запросам. Может комбинироваться с «соответствием по типу страниц». По умолчанию отключен.

Стоп-лист сайтов

Если какие-то сайты вы подозреваете в попадании в топ-10 через постель по особому благословению Яндекса, можете исключить их из рассмотрения добавив в стоп-лист (без wwww). По умолчанию в стоп-листе Яндекс и Википедия. Убираются из рассмотрения анализатором все урлы, которые находятся на любом из указанных доменов или их субдоменов.

Что вы получаете в выходном файлике?

Выходной результат в файле сегментирован по страницам Вначале идет URL и поданные к нему запросы. Для каждого запроса указан статус — участвовал ли он в анализе. (Может не участвовать, если не нашлось ни одного документа в топ-10 Яндекса, подходящего требованиям).

Далее идет таблица фраз и вхождений. В левом столбце — фразы, вхождения которых нужно добавить или убрать. При этом * — обозначает любое слово, кроме слов содержащихся в поданных вами запросах для данной страницы и их словоформ. Например, для запросов
купить розового слона
купить маленького слона

вхождение купить * слона может обозначать «купить большого слона», «купить комнатного слона», и.т.п.

Если фраза взята в квадратные скобки (например: [розовый слон]), то это означает вхождение в любой словоформе кроме присутствующих в любом из поданных запросов. Например, если в вашей задаче были запросы:
розовые слоны
розовый слон стоимость
купить розового слона

То в качестве вхождения для [розовый слон] могут выступить любые словоформы этой пары слов КРОМЕ «розовые слоны», «розовый слон» и «розового слона». При этом важно, что для такого вхождения достаточно отличия словоформы только одного слова.

Если фраза взята в квадратные скобки И содержит звездочку (например: [купить * слон]), то это означает вхождение в любой словоформе кроме присутствующих в любом из поданных запросов со словом вместо звездочки, которое НЕ содержится в запросах ни в точной форме ни в словоформе

Например, для запросов
купить слона розового
купить маленького слона

В качестве вхождения для [купить * слон] может выступить «купить синих слонов» (отличается словоформа «слонов» плюс слова «синих» не содержится в запросах). Но не может «купить розовых слонов», поскольку «розовых» является словоформой «розового», содержащегося в запросе.

Есть 3 раздела в таблице — top-10, diff и src.

  • top-10 — это «эталон», посчитанный по топ-10 Яндекса.
  • diff — разница между вашей страницей и эталоном.
  • src — данные по вашей странице.


В каждом разделе есть данные по 5 зонам документа.

Важное замечание! — это НЕ сумма вхождений по зонам title, text-fragment и plain-text. Это ДОПОЛНИТЕЛЬНЫЕ вхождения к УЖЕ РАСПРЕДЕЛЁННЫМ в эти зоны. При этом для вашей страницы (src) ВСЕГДА должен быть равен нулю для всех вхождений и объёма контента. Поскольку неоднозначность в распределении вхождений может возникнуть только при анализе нескольких документов.

Для каждой фразы указано число вхождений, оцененное анализатором на основании совокупности присутствующих в топе сайтов.
Под фразами расположена строка с числом слов. Также приводится оптимальное значение для каждой зоны и текущее на странице.
Внимание! Слов! Не символов! Если вы хотите перевести слова в символы — умножьте на 7 (средняя длина слова) для текста без пробелов и на 8 если с пробелами.

FAQ по текстовому анализатору.

Q: Анализатор не выдал никаких результатов!
A: Эта ситуация случается когда все запросы выдают “not_url_for_anlz”
Типично два случая:

  • У вас в задаче установлена галочка “соответствие по типу страниц” (она стоит по умолчанию). В этом случае если на вход подана морда — анализатор будет разбирать только морды. Если в топе все страницы внутренние — страниц для анализа нет. И наоборот, если вы подали на анализ внутреннюю, а в топе только главные страницы. Для решения проблемы нужно снять галочку, или (что лучше), пересмотреть распределение запросов по страницам.
  • У вас поставлена галочка “анализировать только пересечения”. В этом случае в разборе будут участвовать только те урлы, которые присутствуют в топ-10 по каждому (!) из поданных для страницы запросов. В этом случае, если таких урлов нет, — ни один запрос проанализирован не будет. Также для этих урлов будет работать правило соответствия морда/внутренняя если стоит соответствующая галочка.

Q: Анализатор не проанализировал мою страницу! В файле только top-10, нет diff и src!
A: Это означает одно из двух:

  • Робот не смог получить доступ к вашей странице. Убедитесь, что сайт не блокирует доступ ботов с немецких IP-адресов.
  • Страница содержит критические ошибки вёрстки. Например — остутствуют закрывающие теги

Анализ текста

Определяйте тональность, ключевые фразы, именованные сущности и язык текста

Бесплатная пробная версия Cognitive Services

7-дневная пробная версия

Бесплатная пробная версия Cognitive Services

  • Кредитная карта не требуется
  • По окончании действия пробной версии данные не сохраняются

Бесплатная учетная запись Azure

Пробное использование с бесплатной учетной записью Azure

  • $200 на счете Azure
  • Неограниченный бесплатный доступ
  • Сохранение данных и настроек

Существующая учетная запись Azure

Уже есть учетная запись Azure?

  • Полный отчет по Соглашению об уровне обслуживания
  • Производительность корпоративного уровня
  • Полная интеграция продуктов Azure
  • Простое увеличение масштаба по мере необходимости

Бесплатная пробная версия Cognitive Services

7-дневная пробная версия

Бесплатная пробная версия Cognitive Services

  • Кредитная карта не требуется
  • По окончании действия пробной версии данные не сохраняются

Бесплатная учетная запись Azure

Пробное использование с бесплатной учетной записью Azure

  • $200 на счете Azure
  • Неограниченный бесплатный доступ
  • Сохранение данных и настроек

Существующая учетная запись Azure

Уже есть учетная запись Azure?

  • Полный отчет по Соглашению об уровне обслуживания
  • Производительность корпоративного уровня
  • Полная интеграция продуктов Azure
  • Простое увеличение масштаба по мере необходимости

Войдите, чтобы продолжить

Вы почти готовы к созданию приложений в 7-дневной бесплатной ознакомительной версии.

Для начала войдите с использованием выбранной учетной записи

Извлечение информации из текста

Чтобы поэкспериментировать с API анализа текста, воспользуйтесь демоверсией ниже. Воспользуйтесь одним из наших примеров или предоставьте собственный. Нажмите кнопку «Анализ», чтобы определить язык, тональность, ключевые фразы и сущности (предварительная версия) в тексте.

Оцените работу решения в действии

i Определенный язык Языки: English (достоверность — 100%)
i Указывает основные тезисы входного текста Ключевые фразы: week, Space Needle, wonderful trip, Seattle, times
i Тональность варьируется от 0 % (абсолютно отрицательная) до 100 % (абсолютно положительная) Тональность:
i Обнаруженные именованные сущности Именованные сущности: Seattle [Location]
last week [DateTime-DateRange]
Space Needle [Location]
Space Needle [Organization]
2 [Quantity-Number]
i Обнаруженные связанные сущности Связанные сущности: I had a wonderful trip to Seattle last week and even visited the Space Needle 2 times!

Хотите создать подобное?

Анализ мнений

API возвращает оценку в баллах между 0 и 1. Оценки, близкие к 1, указывают на позитивную тональность, а оценки, близкие к 0, — на негативную. Балл тональности создается с помощью методов классификации. Функции ввода классификатора включают N-граммы, функции, созданные с помощью лексико-грамматического анализа, и внедрение слов. Эти возможности поддерживаются на разных языках.

Выделение ключевых фраз

Мы используем методы сложного набора средств Microsoft Office для обработки естественных языков. Поддерживаются тексты на английском, немецком, испанском и японском языках.

Определение языка

API возвращает определенный язык и оценку в баллах между 0 и 1. Оценки, близкие к 1, указывают 100 % достоверность, что определенный язык имеет значение true. Поддерживается около 120 языков.

Распознавание именованных сущностей

Найдите в тексте все именованные сущности, например организации, людей, места и многое другое. Функция связывания сущностей устраняет неоднозначность между сущностями, связывая текст с дополнительной информацией в Интернете. Например, с ее помощью можно определить, к какому названию относится термин «times» — к названию газеты «Нью-Йорк Таймс» или площади Таймс-Сквер.

«We found Cognitive Services to be the missing piece in the equation, the one that we needed to bring this solution to market and really revolutionize the way people look at video.»

Katie McCann: Vice President of Product and Engineering | Prism Skylabs

Практическое использование текстового анализа

Алексей Чекушин рассказывает о механике работы текстового анализатора и приводит три самых часто возникающих кейса при его использовании

Ранее я неоднократно писал про текстовый анализ и его роль в современной схеме оптимизации. Пришло время рассмотреть практические аспекты его использования.

Наблюдая за работой оптимизаторов, я замечаю, что многие из них воспринимают текстовый анализатор как систему автоматической генерации ТЗ c использованием ctrl+c и ctrl+v для вставки. Это неправильно. Анализатор – это инструмент, который позволяет проанализировать ТОП за оптимизатора, за секунды или минуты проделав расчеты, которые человек просто не в состоянии выполнить у себя в уме. И задача оптимизатора — не просто вставить результат в ТЗ копирайтеру, а осмыслить его и понять, как нужно оптимизировать свою страницу.

Сегодня будем разбирать как правильно интерпретировать результат анализатора и применять его в своей работе.

Как работает текстовый анализ

Чтобы правильно понимать результат текстового анализа, необходимо знать как появляются цифры в его результате и что они означают. Вот как выглядит типичный результат анализа:

Система разбирает запросы на элементарные вхождения (слова, пары слов в различных вариациях, тройки слов, и т.д.), анализирует их вхождения в различных словоформах, в различных зонах документа и выдает некие «оптимальные» значения. Давайте посмотрим, как они получаются.

Рассмотрим простой пример. Возьмем запрос [пластиковые окна] и посчитаем сколько точных вхождений пластиковые окна содержится на каждой странице из топ-10 внутри тега (без дробления на под-зоны).


Взглянув на эту картинку пристальным взглядом, можно прикинуть, что для попадания в ТОП-10 нам нужно сделать от 8 до 13 вхождений. Может быть, чуть расширив границы диапазона в большую или меньшую сторону, но точно не 30 и не 2. Закономерность четко прослеживается, и мы ее понимаем. Обратите внимание, что отсутствует результат на шестой позиции. Это потому, что там находится страница другого типа – внутренняя. Почему мы разбираем отдельно главные и внутренние страницы – будет рассказано в одном из примеров.

Рассмотрим другой запрос – [купить пластиковые окна]:

Уже гораздо интереснее, правда? Явно, что какая-то очевидная закономерность отсутствует. Логичным предположением будет отбросить явно выбивающиеся (мы не знаем почему они там) из общего тренда значения. Именно это автоматически делает анализатор. Например, мы можем исключить из рассмотрения 1 и 6 значения, как очень низкие, и 5 – как очень высокое. Та цифра, которую вам отдает анализатор – это «середина» данного диапазона. Середина в кавычках, так как алгоритм чуть более сложный. Но в целом смысл такой.

Наконец, мы определились с диапазонами допустимых значений. Переходим к более сложному вопросу – а как определить диапазоны, если у нас есть несколько запросов?

Рассмотрим, опять же, на примере:

В данном случае у нас есть запросы [пластиковые окна] и [купить пластиковые окна]. Необходимо понять, сколько нам можно сделать на странице точных вхождений пластиковые окна. Для этого мы последовательно вычисляем диапазоны допустимых значений для каждого запроса в отдельности, а затем накладываем их друг на друга. Результат наложения – это и будет допустимый диапазон значений для двух запросов. Аналогичным образом это работает и для множества запросов.

Я разобрал самый простой и самый примитивный пример. Анализатор проделывает это для всех возможных вхождений, считает их независимо для всех зон (отдельно точные и словоформы), затем пересекает диапазоны по разным зонам и, наконец, высчитывает вложения запросов друг в друга. (например «окна» будут частью «пластиковые окна», а те, в свою очередь, частью «купить пластиковые окна»).

Примеры текстового анализа

1-й пример. Структура страницы

Текстовый анализ может многое сказать о структуре контента в ТОПе. Например, вот результат анализа по запросу [дизельные генераторы]. Ограничимся при этом внутренними страницами:

Итак, что мы видим?
1) Видим достаточно объемный текст (225 слов – это порядка 1,5 тыс. символов).
2) Видим большой объем «фрагментов» с относительно малым числом вхождений.
3) Видим большое число вхождений в тегах . Особенно в словоформах ([дизельный генератор]).

Это – типичные признаки страницы листинг товаров + SEO текст. Давайте посмотрим, как устроена типичная страница в ТОПе:

Именно такую структуру будет оптимально сделать для нашей продвигаемой страницы. Обратите внимание, что не обязательно придерживаться указанных в анализаторе значений. Это – середина диапазона допустимых значений, но никак не единственно правильное решение.

2-й пример. Оптимизация главной и внутренних страниц

Есть ряд запросов, по которым в топе стоят два различных типа страниц – главная и внутренняя. Посмотрим, чем они могут отличаться. Для этого рассмотрим топ, в котором есть оба типа примерно поровну. Запрос – [такси домодедово]:

Здесь мы видим довольно типичную ситуацию, когда присутствующие в топе внутренние страницы практически не обладают вхождениями в seo-тексте. Иногда он вообще отсутствует для внутренних страниц, там оптимизация размещается во фрагментах и/или в каталоге продукции.

Но, это не всегда работает так. Вот смежный запрос из данной тематики – [такси аэропорт]. Здесь оптимизация главных и внутренних страниц весьма похожа:

Вывод здесь простой – не нужно придерживаться шаблонных мнений о методах оптимизации главной и внутренней страниц. Всегда вначале обращайте внимание, какие закономерности есть в ТОПу именно по вашим запросам.

3-й пример. Низкоконкурентные запросы

Рассмотрим запрос [отели болгарии 4 звезды все включено первая линия]. Это длинный 8-мисловный запрос, который присутствует в подсказочнике и имеет хорошую частотность. Давайте посмотрим на результат текстового анализатора для него:

Что должен сказать оптимизатор глядя на эту таблицу? Что для этого запроса не нужно точного вхождения? Давайте посмотрим, почему так получилось:

Как видим, в ТОПе просто отсутствуют страницы, которые были бы полностью релевантны данному запросу. Ближе всех подобрался hotels.turizm.ru, но у него нет «все включено». Что означает такой результат анализа? Что мы можем не делать вхождения? Нет, совсем наоборот. Если мы сделаем подходящую страницу, и разместим на ней все слова запроса в правильном порядке – скорее всего мы сможем попасть не просто в ТОП-10, а забраться высоко внутри него. Каждый раз когда мы видим «слабый» результат в таблице текстового анализатора, это повод задуматься, может быть мы можем сделать лучше кого-то.

Вместо заключения

Сегодня я разобрал механику работы анализатора и привел три самых часто возникающих кейса при его использовании. Мой основной посыл, который я хочу еще раз повторить – не «генерируйте ТЗ». Используйте текстовый анализатор именно как инструмент анализа и обязательно включайте мозг. Тогда ваши сайты будут в ТОПе, а волосы – мягкими и шелковистыми.

Все примеры выполнены при помощи текстового анализатора JustMagic. Его можно попробовать самому (онлайн, бесплатно, c регистрацией, но без смс).

Текстовый анализ cайта

Текстовый анализатор – это уникальная и сложная система, которая способна на языке цифр подсказать, как конкретно вам следует изменить тексты на сайте.

Система сканирует ваш сайт и сайты ваших конкурентов и выявляет оптимальную величину того, сколько раз те или иные словосочетания должны встречаться на каждой из продвигаемых страниц вашего сайта.

Это совершенно бесплатно!

Наш текстовый анализатор создан в помощь вам для выявления недостатков оптимизации.

Расчет % оптимизированности и рекомендаций идет, исходя из анализа вашего сайта и сайтов-конкурентов, которые уже есть в топе. Меняется топ — меняются рекомендации и % оптимизации.

Инструмент очень полезен, как помощь, в оптимизации контента. Но все-таки рекомендации не стоит без оглядки сразу вносить на сайт. Тем более, если позиции по фразе хорошие, возможно и не стоит вообще вносить корректировки.

Почему так? Топ формируется не только за счет текстовых факторов, но также за счет ссылочных и поведенческих факторов. Этого наш ТА не учитывает, это должен учитывать сам оптимизатор сайта.
Поэтому, прежде чем вносить существенные изменения, просмотрите топ (сайты топа также указаны на странице ТА по фразе, проверьте их). Опять же «требования Яндекса» — это совокупный результат анализа всех сайтов топа, поэтому до полного соответствия доводить не нужно, до 100% оптимизированности тоже.

Достаточно поддерживать на уровне выше 70-75 %, проверять этот процент после каждого апдейта. Если будут замечены существенные падения % оптимизации, то тогда проверить, в чем причина, провести необходимые изменения.

Полезные стаить по текстовой оптимизации:

Текстовый анализатор на группе запросов

17:50 16 ноября 2020 — Хиврин Николай

Текстовый анализатор является достаточно популярным приложением MegaIndex и позволяет неплохо оптимизировать страницу под заданный запрос. Благодаря этому приложению можно всего за несколько минут сделать страницу, контент которой будет максимально похож на документы, которые сейчас ранжируются на первых местах.

Но почти всегда оптимизаторам нужно продвигать страницу по нескольким запросам, а это значительно усложняет задачу. Мы можем оптимизировать страницу под один запрос, но потерять релевантность по другой фразе.

Новая версия текстового анализатора позволяет указать несколько запросов и выбрать по этой массе запросов самые жесткие требования, которые необходимо реализовать для достижения высокой релевантности по всем фразам

Рассмотрим пример работы такого алгоритма. Допустим, Вы решили продвигать два совершенно разных запроса «окна» и «перевозки» на одну страницу, рассмотрим требования, которым должен удовлетворять такой документ:

Как видно из примера, документ должен включать различные слова, которые относятся к этим различным запросам: окна, переезды, пластиковые, грузоперевозки и т.д.

А TITLE пришлось бы писать по таким требованиям, что почти невозможно:

Таким образом, Вы легко сможете добавить продвигаемые запросы на страницу и доработать оптимизацию с учетом новых требований.

Рассмотрим более разумную задачу по оптимизации 4 запросов на один документ:

Здесь мы видим уже более реальные требования к контенту и оценку того, что нужно доработать:

Система сразу подскажет, что в TITLE нужно добавить слово «аудит», но нет необходимости добавлять слово «проверка», которое есть в списке запросов:

Анализ текста

Содержание:

Комплексный анализ текста — (греч. Analysis разложение, расчленение) — операция расчленения текста на составные части, выполняемая в процессе познания или предметно-практической деятельности человека.

Vaal-mini 1.5

Интерфейс: Русский Платформа: Обновлено: 2009-01-23 Разработчик: Платный аналог:

Программа для комплексного анализа эмоционального и фоносемантического воздействия на человека текстов и отдельных слов. Для оценки воздействия используются специальные шкалы.

Специалисты в области языковедения и психологии давно заметили, что каждое слово, предложение или даже целый текст несут в себе не только чисто информативную нагрузку, но и психологическую. Это значит, что одно и то же выражение, сказанное разными словами, может по-разному влиять на человека, в зависимости от фоносемантической окраски каждого отдельно взятого слова в нем.

Вплоть до 90-х годов прошлого века многие компании мира тратили огромные суммы денег для оплаты работы специалистов, которые занимались подбором благозвучных названий для новой продукции и брэндов. Но в 1992 году группа энтузиастов задалась целью создать компьютерную программу, которая автоматизировала бы весь этот процесс.

Проект получил название — ВААЛ. Результатом более чем 15-летней деятельности творческой группы проекта стала программа ВААЛ-мини (на сегодняшний день уже 8-я версия).

Области применения и возможности программы для анализа текста Vaal-mini

Давайте рассмотрим области применения данной программы согласно с рекомендациями официального сайта:

  • Составление текстов выступлений с заранее заданными характеристиками воздействия на потенциальную аудиторию.
  • Активное формирование эмоционального отношения к политическому деятелю со стороны различных социальных групп.
  • Составление эмоционально окрашенных рекламных статей.
  • Поиск наиболее удачных названий и торговых марок.
  • Психо- и гипнотерапия.
  • Неявное психологическое тестирование и экспресс-диагностика.
  • Создание легких в усвоении учебных материалов.
  • Научные исследования в области психолингвистики и смежных с нею дисциплинах.
  • Журналистика и другие сферы деятельности, использующие в качестве инструмента СЛОВО.
  • Социологические и социолингвистические исследования.
  • Информационные войны.
  • Контент-анализ текстов.
  • Мониторинг СМИ.

Система также позволяет:

  • Оценивать неосознаваемое эмоциональное воздействие фонетической структуры текстов и отдельных слов на подсознание человека.
  • Подбирать слова с заданными фоносемантическими характеристиками.
  • Задавать характеристики желаемого воздействия и целенаправленно редактировать тексты для достижения указанных характеристик.
  • Корректировать текст по выбранным параметрам.
  • Настраиваться на различные социальные и профессиональные группы людей, которые могут быть выделены по используемой ими лексике.
  • Оценивать звуко-цветовые характеристики текстов.
  • Производить факторный анализ данных с последующей визуализацией результатов.
  • Осуществлять полноценный контент-анализ текста по большому числу специально составленных встроенных категорий.
  • Производить эмоционально-лексический анализ текстов.

Как видим, список вариантов использования ВААЛ-мини очень широк и может заинтересовать широкий круг пользователей.

Установка и запуск Vaal-mini

Рассмотрим программу в действии. Для начала, скачаем архив с программой и установим саму программу на Ваш компьютер. Запускаем .exe файл и «соглашаемся» со всем, что нам предлагают. После стандартной процедуры инсталляции на рабочем столе появится ярлык Vaal-mini — забавный кувшин с дымком (джинн, наверное :-)).

Функции и интерфейс программы

Запустив программу, Вы увидите окно, похожее на стандартный «WordPad» Windows.

Интерфейс — очень наглядный. Его условно можно разделить на 2 части: «кнопки управления» и «меню».

— кнопка «Создать», создает новый документ.

— кнопка «Открыть», открывает уже существующий документ (только формат .txt).

— кнопка «Сохранить», сохраняет текущий документ.

— кнопка «Печать», позволяет распечатать текущий текст.

— кнопка «Отмена», позволяет отменить последнее действие.

— кнопка «Вырезать», удаляет выделенную часть текста в буфер обмена, с последующей возможностью вставки.

— кнопка «Копировать», копирует выделенную часть текста в буфер обмена.

— кнопка «Вставить», вставляет фрагмент текста из буфера обмена.

— поле для ввода отдельных слов.

— кнопка «Оценка слова», позволяет произвести фоносемантический анализ одного введенного слова.

— кнопка «Оценка текста», позволяет произвести фоносемантический анализ целого текста.

— панель выбора языка для анализа.

— данное меню позволяет создать новый документ, открыть существующий, или сохранить текущий. Также с его помощью можно произвести настройку параметров печати и распечатать документ.

— данное меню дает возможность работать с буфером обмена (отмена последнего действия, вырезание, копирование и вставка из буфера), а также производить настройку параметров шрифта (шрифт, начертание (обычное, курсив, жирное и жирный курсив), размер, видоизменение (зачеркнутый, подчеркнутый), цвет. В окошке «Образец» можно сразу увидеть, как видоизменится начертание текста).

— это меню предоставляет возможность произвести эмоциональный анализ одного слова или целого текста.

— из этого меню мы можем получить доступ к системе справки, а также получить общие сведения о системе ВААЛ.

Работа с программой на примере отдельных слов

Как видим — ничего сложного. Теперь — конкретные примеры. Как Вы уже поняли, можно анализировать как текст, так и отдельное слово. Начнем со слов. Для примера возьмем русские имена: Иван и Варвара.

Вводим имя Иван в поле для ввода слов и нажимаем на кнопку «Анализ слова». В открывшемся окне мы видим результат фоносемантической оценки слова.

Для русского языка эти результаты представлены в виде 24 шкал с парами антонимических прилагательных:

  • хороший — плохой;
  • красивый — отталкивающий;
  • радостный — печальный;
  • светлый — темный;
  • легкий — тяжелый;
  • безопасный — страшный;
  • добрый — злой;
  • простой — сложный;
  • гладкий — шероховатый;
  • округлый — угловатый;
  • большой — маленький;
  • грубый — нежный;
  • мужественный — женственный;
  • сильный — слабый;
  • холодный — горячий;
  • величественный — низменный;
  • громкий — тихий;
  • могучий — хилый;
  • веселый — грустный;
  • яркий — тусклый;
  • подвижный — медлительный;
  • быстрый — медленный;
  • активный — пассивный.

Для украинского языка этих шкал всего 7:

  • большой — маленький,
  • приятный — неприятный;
  • быстрый — медленный;
  • холодный — теплый;
  • сильный — слабый;
  • темный — светлый;
  • твердый — мягкий.

Ниже (под шкалами) мы видим, какое впечатление производит на человека данное слово. При этом для составления любого впечатления слово должно иметь не менее 30% по данной характеристике. В нашем случае мы видим, что слово «Иван» оставляет хорошее впечатление.

В самом низу оценочного окна можно увидеть полосу, состоящую из нескольких цветов. Ни для кого не секрет, что каждый цвет спектра ассоциируется у человека с каким-либо настроением или эмоцией. Эта шкала передает нам подсознательное цветовосприятие анализируемого слова.

Для того, чтобы проанализировать слово «Варвара» не надо возвращаться к основному окну программы, — достаточно ввести его в поле в правом нижнем углу вкладки анализа, предварительно удалив слово «Иван».

Работа с текстом и документами

Со словами разобрались. Теперь перейдем к текстам. Программа ВААЛ-мини может дать фоносемантическую характеристику и целому тексту в зависимости от слов, которые в нем преобладают.

Текст можно набирать непосредственно в окне программы, используя ее, как простейший текстовый редактор. Для этого мы задаем параметры нашего текста в меню «Редактировать» — «Шрифт».

Можно пойти другим путем и открыть для анализа уже существующий текст в формате .txt! Для этого нажимаем кнопку «Открыть» (1) и выбираем любой текстовый документ с Вашего жесткого диска. После того, как текст откроется, нажимаем кнопку «Анализ текста» (2) и получаем результат:

При желании текст, как и результат анализа, можно распечатать на принтере прямо из программы.

Выводы

Таким образом, ВААЛ-мини будет незаменимым помощником при составлении писем, официальных документов и вообще любой текстовой информации, так как Вы сможете заранее спрогнозировать, как отреагирует на этот текст Ваш адресат.

Используйте ВААЛ-мини и Вы заметите, насколько легко, просто и быстро можно воздействовать на других людей при помощи силы СЛОВА.

Илон Маск рекомендует:  Функции bios int 14h ввод вывод через последовательный порт
Понравилась статья? Поделиться с друзьями:
Кодинг, CSS и SQL