О МНОЖЕСТВЕ АНАГРАММ И РАСПОЗНАВАНИИ ИХ ЭЛЕМЕНТОВ
Авторы: З.Д.Усманов, В.Нормантас
Рассмотрены три способа кодирования слов. Выявлены их статистические закономерности и установлены мощности множеств анаграмм в текстовых корпусах английского, литовского, русского и таджикского языков, а также искусственного языка эсперанто. Предложены три модифицированных способа кодирования, реализующие с близкими к единице относительными частотами взаимно однозначные отображения между словами и их кодами.
ОБ УПОРЯДОЧЕННОМ АЛФАВИТНОМ КОДИРОВАНИИ
СЛОВ
ЕСТЕСТВЕННЫХ ЯЗЫКОВ
Автор: З.Д. Усмонов
В статье дается определение упорядоченного алфавитного кодирования, согласно которому слову ставится в соответствие его же набор букв, расположенных в алфавитном порядке. Отмечаются свойства прямого и обратного отображения множества слов на множество их кодов-образов. Формулируются задачи статистического исследования предложенного отображения на примере естественных языков.
О МНОГООБРАЗИИ СЛОВОФОРМНЫХ АНАГРАММ
Авторы: З. Д. Усмонов, Г.М. Довудов
Посредством специального кодирования словоформ формируются многообразия анаграмм текстовых коллекций английского и русского языков. Получены статистические данные о количестве различных анаграмм с заданным числом элементов. Анонсирован ряд анаграмм наибольшей мощности.
СТАТИСТИЧЕСКИЕ СВОЙСТВА αβ-КОДИРОВАНИЯ СЛОВ ЕСТЕСТВЕННЫХ ЯЗЫКОВ
Автор: З. Д. Усмонов
На корпусах текстов изучены статистические свойства αβ - кодирования и его модификации. Установлены, в частности, мощности множеств анаграмм четырех естественных языков и языка эсперанто.
Алгоритм безударного озвучивания таджикского текста
Авторы: З.Д. Усманов, Х.А. Худойбердиев
Работы [1-3], выполненные авторами в соответствии с программой, сформулированной в [4], и посвященные исследованию статистических зако номерностей слогового многообразия таджикского языка, являлись необхо димой предпосылкой на пути достижения главной цели – решения задачи ав томатического преобразования таджикского текста в озвученную человече скую речь с безударным произношением каждого слова.
О МНОГООБРАЗИИ СЛОГОВ ТАДЖИКСКОГО ЯЗЫКА
Авторы: Х.Т. Максудов, О.М. Солиев, Х.А.Худойбердиев
Настоящая работа продолжает исследования, начатые в ста тьях [1],[2], и посвящается описанию многообразия слогов таджикского язы ка. Полученные здесь результаты основываются на статистической обработке текстовой информации, содержавшейся на 3800 страницах репрезентативной выборки, извлеченной из художественных произведений и газетных статей...
О МНОЖЕСТВЕ АНАГРАММ ТАДЖИКСКОГО ЯЗЫКА
Авторы: З. Д. Усмонов, Г.М. Довудов, С.Д. Холматова
Посредством специального кодирования словоформ исчерпывающим образом описывается многообразие анаграмм корпуса текстов таджикского языка. Получены статистические данные о количестве различных анаграмм заданной мощности. Анонсирован ряд анаграмм с наибольшим количеством элементов.
О СЛОГОВОЙ СТРУКТУРЕ СЛОВ ТАДЖИКСКОГО ЯЗЫКА
Авторы: З.Д. Усманов, Х.А.Худойбердиев
Введение. Слогом, согласно определению, называется минимальная произносительная единица речи, состоящая из одного или нескольких звуков, которые образуют тесное фонетическое единство. В соответствии с несколько иной эквивалентной интерпретацией, слог это - звук или сочетание звуков в слове, произносимые одним толчком выдыхаемого воздуха.
ОБ ОДНОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО РАЗМЕЩЕНИЯ И ЕЁ ПРИЛОЖЕНИИ
Авторы: З.Д.Усманов, И.Л.Васильева
Пусть A = {a(1),a(2),...,a(n)} - упорядоченное n - множество символов и C = {C1, C2,..., Cr} - упорядоченное r - множество ячеек, в которых размещаются наборы символов с сохранением порядка, т.е.
ОБ АВТОМАТИЧЕСКОМ РАЗЛОЖЕНИИ СЛОВ НА СЛОГИ
Автор: Х.А.Худойбердиев
В настоящей статье дается концептуальное описание последовательности процедур, реализация которых в виде компьютерной программы позволяет осуществлять автоматическое разделение произвольного таджикского слова на слоги.
О СИНТЕЗАТОРЕ ТАДЖИКСКОЙ РЕЧИ ПО ТЕКСТУ
Авторы: З.Д. Усманов, Х.А.Худойбердиев
В настоящей статье излагается основная идея реализации синтезатора таджикской речи по тексту.
О СИНТЕЗЕ ТАДЖИКСКОЙ РЕЧИ С РУСИЗМАМИ
Авторы: З.Д. Усманов, Х.А.Худойбердиев
В этой статье речь идет о синтезе таджикской речи с использованием русских слов.
ЭРГОНОМИЧНАЯ РАСКЛАДКА ТАДЖИКСКОГО АЛФАВИТА
НА КЛАВИАТУРЕ МОБИЛЬНОГО ТЕЛЕФОНА
Авторы: З.Д.Усманов, И.Л.Васильева
В настоящее время мобильных телефонов с таджикской клавиатурой не существует, однако нельзя исключать того, что потребность в них появится в самом ближайшем будущем.