О МНОЖЕСТВЕ АНАГРАММ И РАСПОЗНАВАНИИ ИХ ЭЛЕМЕНТОВ
О МНОЖЕСТВЕ АНАГРАММ И РАСПОЗНАВАНИИ ИХ ЭЛЕМЕНТОВ
Авторы: З.Д.Усманов, В.Нормантас
Рассмотрены три способа кодирования слов. Выявлены их статистические закономерности и установлены мощности множеств анаграмм в текстовых корпусах английского, литовского, русского и таджикского языков, а также искусственного языка эсперанто. Предложены три модифицированных способа кодирования, реализующие с близкими к единице относительными частотами взаимно однозначные отображения между словами и их кодами.
ОБ УПОРЯДОЧЕННОМ АЛФАВИТНОМ КОДИРОВАНИИ СЛОВ ЕСТЕСТВЕННЫХ ЯЗЫКОВ
ОБ УПОРЯДОЧЕННОМ АЛФАВИТНОМ КОДИРОВАНИИ
СЛОВ
ЕСТЕСТВЕННЫХ ЯЗЫКОВ
Автор: З.Д. Усмонов
В статье дается определение упорядоченного алфавитного кодирования, согласно которому слову ставится в соответствие его же набор букв, расположенных в алфавитном порядке. Отмечаются свойства прямого и обратного отображения множества слов на множество их кодов-образов. Формулируются задачи статистического исследования предложенного отображения на примере естественных языков.
СТАТИСТИЧЕСКИЕ СВОЙСТВА αβ -КОДИРОВАНИЯ СЛОВ ЕСТЕСТВЕННЫХ ЯЗЫКОВ
СТАТИСТИЧЕСКИЕ СВОЙСТВА αβ-КОДИРОВАНИЯ СЛОВ ЕСТЕСТВЕННЫХ ЯЗЫКОВ
Автор: З. Д. Усмонов
На корпусах текстов изучены статистические свойства αβ - кодирования и его модификации. Установлены, в частности, мощности множеств анаграмм четырех естественных языков и языка эсперанто.
О МНОГООБРАЗИИ СЛОВОФОРМНЫХ АНАГРАММ
О МНОГООБРАЗИИ СЛОВОФОРМНЫХ АНАГРАММ
Авторы: З. Д. Усмонов, Г.М. Довудов
Посредством специального кодирования словоформ формируются многообразия анаграмм текстовых коллекций английского и русского языков. Получены статистические данные о количестве различных анаграмм с заданным числом элементов. Анонсирован ряд анаграмм наибольшей мощности.
Алгоритм безударного озвучивания таджикского текста
Алгоритм безударного озвучивания таджикского текста
Авторы: З.Д. Усманов, Х.А. Худойбердиев
Работы [1-3], выполненные авторами в соответствии с программой, сформулированной в [4], и посвященные исследованию статистических зако номерностей слогового многообразия таджикского языка, являлись необхо димой предпосылкой на пути достижения главной цели – решения задачи ав томатического преобразования таджикского текста в озвученную человече скую речь с безударным произношением каждого слова.