吳浩笑著搖了搖頭道:“不,它還只是一個未完成品,這上面還有很多問題需要我們解決的。
比如剛才對話中,它對於模糊性語境的理解處理就比較困難。”
“模糊性語境?”
鄒小東愣了一下,很快明白過來道:“這個好像咱們真人理解起來都比較困難,更何況機器程式了呢。
老大,我有些不太理解。語音識別和語音對話這方面目前大部分科技公司都在做,而且成果也不錯。
這些語音軟體對於我們正常說話的識別程度也很高,基本上能達到百分之九十九以上。
但是這些軟體的反應速度遠沒有我們這套技術的識別速度快,理解能力也沒有它強,聯想處理能力也比不上。
另外,在語音對話方面,你是怎麼做到的,讓機器的語言能這麼接近真人聲音。
要知道人類的聽覺還是很靈敏,是人還是機器程式聲音還是很快能夠區分出來的。”
吳浩聽到鄒小東的一大堆問題,衝他反問道:“你覺得真人聲音和AI語音最大的區別是什麼?”
鄒小東想了一下,然後答道:“少了平仄頓挫?”
吳浩搖了搖頭道:“這不是最關鍵的,事實上目前市面上的一些語音軟體已經能夠進行簡單的平仄頓挫感了。”
“那是……”
吳浩看著鄒小東那百思不得其解的樣子,笑著說道:“感情,目前市面上所有的語音程式軟體都少了感情。”
“感情,這開什麼玩笑,程式怎麼可能有感情,這是人才有的啊。”鄒小東搖頭無法理解道。
吳浩笑了笑,然後控制電腦在大螢幕上顯示出結構示意圖道:“與其說是感情,不如說是語言溫度。
我們在說話的時候,對方能夠清楚的感知到我們說話時候的情緒變化,這是感情,這也是語言溫度。
而語言程式呢,則是按照固定的定式來進行反應。所以它無法理解每句話的溫度,自然在生成語音方面也就沒有溫度了。
我們要做的是在語音識別定式過程中,加入對於語言詞彙環境的理解,並從不同的音調中分析出話語的溫度以及說話人的情緒變化。”
“我還是不能理解,人在說話時候所表現出來的情緒千變萬化,程式如何能夠捕捉出來。要知道有時候語言和語氣上的輕微變化,就能表現出截然不同的兩種意思和兩種情緒,機器如何分辨。”鄒小東說出自己的疑問道。
吳浩笑著邊演示螢幕中的內容,邊衝著他回道:“這就運用到AI技術了,每個人的語言語調不同,情緒表達方面也是千變萬化。如果按照傳統方式,我們需要對於這些千變萬化的語言語調語境進行抓取收集分析,從而進行定義。如果是這樣的話,那工作量可就太大了。
所以AI技術的學習進化能力就讓我找到了思路,我們可以透過抓取網際網路上那愛心海量的語音資訊來訓練出一套基本的AI語音程式。
當然,這只是基本程式樣本,我們需要根據使用者的習慣進行相應的調整適應。讓程式來學習適應使用者,使用者使用的時間越長,AI識別程式的識別理解程度也就越準確。”
說到這,吳浩笑道:“這其實和我們真人在現實社會中相處的過程很像,兩個陌生人認識相處後,雙方都在逐漸摸清適應對方。
時間越久,雙方間也就越熟悉。甚至一方一個簡單的詞,手勢或者眼神,另一方都能準確的接收理解,這就是所謂的默契。
而我們要做的則就是培養程式和人的默契,但使用者是很難改變的,只能潛移默化的影響。所以我們得從程式軟體開始,讓它來適應使用者,並在潛移默化下改變使用者。
只有這樣,人機互動才會更加默契。