Сөйлеуді танудың негіздері
Автор: Aibek_02 • Октябрь 12, 2022 • Реферат • 3,667 Слов (15 Страниц) • 257 Просмотры
Кіріспе.......................................................................................... 3.
1-Тарау. Сөйлеуді танудың негіздері........................................ 6.
2-Тарау. Жасырын Марков моделдері ..................................... 14.
3-Тарау. Тәжірибелік-эксперименттік жұмыс туралы есептер,
нәтижелерді салыстыру және талдау........................................ 20.
Қорытынды ................................................................................. 21.
КІРІСПЕ
Қазіргі уақытта аудио ағыны бар компьютерлер үшін жоғары дәлдіктегі жұмыс құралдарын жасау қажеттілігі туындауда. Мұндай жүйелердің қолданылу орындарын барлық жерден табуға болады. Мақсаттар әскери және инженерліктен Әлеуметтік және жеке мақсаттарға дейін әртүрлі болуы мүмкін. Қазіргі уақытта ең сәтті құралдардың бірі-жасырын Марков модельдері (ЖММ). Бұл жұмыс дәл осы әдіске арналғанына қарамастан, оларды салыстыру үшін аудио ағынмен жұмыс істеудің басқа әдістері де айтылады.
Компьютер адамның сөйлеуін түсінуді үйренгенде, біз жасанды интеллектті тез құра аламыз деп болжанған. Бірақ сөйлеуді тану жүйелерінің дәлдігі 1999 жылы шарықтау шегіне жетті және содан бері орнында қатып қалды. 2006 жылғы академиялық тестілер мынандай фактіні көрсетеді: жалпы жүйелер ешқашан 80% деңгейден өте алмады, ал адамда бұл көрсеткіш 96-98% құрайды.
Тапсырманың күрделілігін елестетіп көріңіз. Кейбір бағалаулар бойынша адам тіліндегі мүмкін сөйлемдердің саны 10570 құрайды. Құжатталған дереккөздерде олардың аз ғана бөлігі жазылған, сондықтан адамдар жасаған барлық мәтіндерді "енгізседе" де, жүйені үйрету мүмкін емес.
Тілдегі көптеген сөздердің жүздеген немесе мыңдаған мағыналары бар. Нақты мағынаны таңдау контекстке, яғни айналадағы сөздерге байланысты. Ауызша сөйлеуде ол бет әлпетіне немесе интонацияға байланысты.
Біздің миымыз функционалды грамматиканың интуитивті ережелерін және әр сөзге байланысты семантикалық парадигмасын қолдана отырып, мәтінді толығымен өзі жасай алады. Әр сөздің мағынасы алдыңғы сөздің мағынасына байланысты, ал күрделі жағдайларда біздің миымыз сөйлеуді тек контекстті біле отырып, сөз тіркестерінің үзінділерінен таниды.
Функционалды грамматиканың негізгі ережелері әр адамға түсінікті, бірақ оларды компьютерге түсінікті ету үшін рәсімдеу мүмкін емес, ал онсыз болмайды. Компьютер бұрын кездеспеген сөйлемдерді тануға тырысқанда, егер оның грамматикалық талдаушысы және адам миына ендірілген семантикалық парадигмалары бар сөздігі болмаса, ол тануда сөзсіз қателіктер жібереді.
Google интернетте жарияланған мәтіндердің ең үстіртін талдауы триллион нысанды анықтады. Бұл біздің сөйлеуімізді құрайтын морфемалардың аз ғана бөлігі. Google мәтіндері бар 24 гигабайттық мұрағатты жалпыға қол жетімді етіп орналастырды және осыдан кейін тақырып бойынша одан әрі ақпарат жариялауды тоқтатты.
Mindnet-тің "әмбебап талдаушы" жобасын Microsoft 1991 жылы бастады. Олар сөздер арасындағы барлық мүмкін қатынастардың әмбебап картасын құруға тырысты. Жобаға көп күш пен қаржы жұмсалды, бірақ 2005 жылы зерттеулерді іс жүзінде тоқтатуға мәжбүр болды.
Media Research институтының профессоры Роберт Фортнер сөйлеуді тану жүйелерін жасаушылар ақыры тығырыққа тірелді деп санайды. Бағдарламашылар қолдарынан келгеннің бәрін жасады және олар сәтсіздікке ұшырады. Бірнеше онжылдықтардан кейін олар адамның сөйлеуі тек дыбыстардың жиынтығы емес екенін түсінді. Акустикалық сигнал мәтінді тану үшін жеткілікті ақпарат бермейді.
Қазіргі кездегі сөйлеуді тану жүйелерінің кемшіліктері нақты сөйлеу мен қолданылатын әдістердің негізінде жатқан математикалық модельдер арасындағы толық емес сәйкестікпен түсіндіріледі. Сөйлеуді тану жүйесінің сапасы көптеген параметрлермен анықталады. Атап айтқанда, тану дәлдігі, жүйенің шуға төзімділігі, дикторға тәуелділік дәрежесі, микрофон параметрлеріне тәуелділік үлкен рөл атқарады. Барлық қажетті параметрлерді ескеретін толық математикалық модельді құру қиын мәселе болып көрінеді. Бүгінгі таңда жасырын Марков модельдерінің (ЖММ) аппараты сөйлеуді тану үшін де, оны синтездеу үшін де қолданылатын сөйлеу технологиялары саласындағы дефакто стандарты болып табылады.
...