+992 (92) 840-10-04

О МНОЖЕСТВЕ АНАГРАММ И РАСПОЗНАВАНИИ ИХ ЭЛЕМЕНТОВ

Авторы: З.Д.Усманов, В.Нормантас

Рассмотрены три способа кодирования слов. Выявлены их статистические закономерности и установлены мощности множеств анаграмм в текстовых корпусах английского, литовского, русского и таджикского языков, а также искусственного языка эсперанто. Предложены три модифицированных способа кодирования, реализующие с близкими к единице относительными частотами взаимно однозначные отображения между словами и их кодами.

Скачать в формате PDF

ОБ УПОРЯДОЧЕННОМ АЛФАВИТНОМ КОДИРОВАНИИ СЛОВ
ЕСТЕСТВЕННЫХ ЯЗЫКОВ

Автор: З.Д. Усмонов

В статье дается определение упорядоченного алфавитного кодирования, согласно которому слову ставится в соответствие его же набор букв, расположенных в алфавитном порядке. Отмечаются свойства прямого и обратного отображения множества слов на множество их кодов-образов. Формулируются задачи статистического исследования предложенного отображения на примере естественных языков.

Скачать в формате PDF

СТАТИСТИЧЕСКИЕ СВОЙСТВА αβ-КОДИРОВАНИЯ СЛОВ ЕСТЕСТВЕННЫХ ЯЗЫКОВ

Автор: З. Д. Усмонов

На корпусах текстов изучены статистические свойства αβ - кодирования и его модификации. Установлены, в частности, мощности множеств анаграмм четырех естественных языков и языка эсперанто.

Скачать в формате PDF

О МНОГООБРАЗИИ СЛОВОФОРМНЫХ АНАГРАММ

Авторы: З. Д. Усмонов, Г.М. Довудов

Посредством специального кодирования словоформ формируются многообразия анаграмм текстовых коллекций английского и русского языков. Получены статистические данные о количестве различных анаграмм с заданным числом элементов. Анонсирован ряд анаграмм наибольшей мощности.

Скачать в формате PDF

Алгоритм безударного озвучивания таджикского текста

Авторы: З.Д. Усманов, Х.А. Худойбердиев

Работы [1-3], выполненные авторами в соответствии с программой, сформулированной в [4], и посвященные исследованию статистических зако­ номерностей слогового многообразия таджикского языка, являлись необхо­ димой предпосылкой на пути достижения главной цели – решения задачи ав­ томатического преобразования таджикского текста в озвученную человече­ скую речь с безударным произношением каждого слова.

Скачать в формате PDF