午夜无码免费视频一区二区,97欧美精品系列一区二区

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

AI語(yǔ)音二三事：你需要了解這些AI 語(yǔ)音對(duì)話技術(shù)

Baolan

2017-11-22

2 評(píng)論 23458 瀏覽 95 收藏

9 分鐘

機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理技術(shù)的進(jìn)步，開啟了人與人工智能進(jìn)行語(yǔ)音交互的可能，人們透過對(duì)話的方式獲取信息、與機(jī)器進(jìn)行交互，將不再只是存在科幻情結(jié)當(dāng)中。語(yǔ)音交互是未來(lái)的方向，而智能音箱則是語(yǔ)音交互落地的第一代產(chǎn)品。

一、語(yǔ)音交互流程簡(jiǎn)介

AI 對(duì)話所需要的技術(shù)模塊有 4 個(gè)部分，分別為：

自動(dòng)語(yǔ)音識(shí)別（Automatic Speech Recognition, ASR）
自然語(yǔ)言理解（Natural Language Understanding, NLU）
自然語(yǔ)言生成（Natural Language Generation, NLG）
文字轉(zhuǎn)語(yǔ)音（Text to Speech, TTS）

以叮咚開發(fā)文檔中的語(yǔ)音交互流程圖來(lái)看Ai 對(duì)話技術(shù)的主要路徑：

從上圖中可以看到，用戶與設(shè)備之間的交互，主要是采用語(yǔ)音方式處理和完成的。

二、語(yǔ)音交互流程設(shè)計(jì)

一次完整的語(yǔ)音交互流程，成功的語(yǔ)音對(duì)話，通常是有以下幾個(gè)階段。

1.交互流程的核心—意圖

所謂意圖，表示用戶在使用應(yīng)用時(shí)所做的動(dòng)作(譬如：?jiǎn)栆粋€(gè)問題或發(fā)送一條指令)，這些意圖代表了應(yīng)用的核心功能。

如果應(yīng)用成功地識(shí)別了用戶意圖，則需要在完成業(yè)務(wù)動(dòng)作后，將結(jié)果反饋給用戶；如果應(yīng)用無(wú)法識(shí)別用戶意圖，則需要給用戶友好的提示，指導(dǎo)用戶使用。

用戶：七星彩的開獎(jiǎng)時(shí)間是什么時(shí)候？

Ai：體育彩票七星彩每周二、周四和周日開獎(jiǎng)。

2. 如何識(shí)別意圖—語(yǔ)義解析

對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行分析理解，簡(jiǎn)單來(lái)說就是將用戶語(yǔ)音輸入映射到機(jī)器指令。它可能定義了一組包含指定的單詞或短語(yǔ)的語(yǔ)法結(jié)構(gòu)，用戶通過說出滿足這種結(jié)構(gòu)的語(yǔ)句，來(lái)調(diào)用意圖。

用戶：我要{聽} {周杰倫}的{稻香}

Ai：稻香.mp3

3.如何處理意圖—云端交互

調(diào)用意圖的結(jié)構(gòu)化請(qǐng)求，向服務(wù)器請(qǐng)求處理后做出反饋?lái)憫?yīng)。通俗來(lái)講該流程主要處理用戶的請(qǐng)求，解決用戶問題的答案。

4.上下文意圖的處理-對(duì)話管理

在用戶進(jìn)行自然對(duì)話時(shí)，可能會(huì)因?yàn)楸磉_(dá)事情的復(fù)
雜

度、時(shí)間、地點(diǎn)、效率等，產(chǎn)生具有脈絡(luò)的對(duì)話過程，所有的對(duì)話元素會(huì)編織在一個(gè)連貫的線性對(duì)話中。

用戶：明天北京天氣如何？

Ai：明天北京天氣晴，溫度16到23度

用戶：后天呢？{后天北京天氣如何？}

Ai：后天北京天氣晴，溫度17到28度

5，語(yǔ)言合成模塊 – 組織語(yǔ)言

根據(jù)解析模塊得到的內(nèi)部表示，在對(duì)話管理機(jī)制的作用下生成自然語(yǔ)言句子。同時(shí)將生成模塊生成的句子轉(zhuǎn)換成語(yǔ)音輸出。（把回答的機(jī)器語(yǔ)言再轉(zhuǎn)換成口語(yǔ)語(yǔ)言）

三、?中文自然語(yǔ)言處理的關(guān)鍵技術(shù)

1、詞法分析

詞法分析包括詞形和詞匯兩個(gè)方面。一般來(lái)講，詞形主要表現(xiàn)在對(duì)單詞的前綴、后綴等的分析，而詞匯則表現(xiàn)在對(duì)整個(gè)詞匯系統(tǒng)的控制。在中文全文檢索系統(tǒng)中，詞法分析主要表現(xiàn)在對(duì)漢語(yǔ)信息進(jìn)行詞語(yǔ)切分，即漢語(yǔ)自動(dòng)分詞技術(shù)。通過這種技術(shù)能夠比較準(zhǔn)確的分析用戶輸入信息的特征，從而完成準(zhǔn)確的搜索過程。它是中文全文檢索技術(shù)的重要發(fā)展方向。

2、句法分析

句法分析是對(duì)用戶輸入的自然語(yǔ)言進(jìn)行詞匯短語(yǔ)的分析，目的是識(shí)別句子的句法結(jié)構(gòu)，實(shí)現(xiàn)自動(dòng)句法分析過程。其基本方法有線圖分析法、短語(yǔ)結(jié)構(gòu)分析、完全句法分析、局部句法分析、依存句法分析等。

3、語(yǔ)義分析

語(yǔ)義分析是基于自然語(yǔ)言語(yǔ)義信息的一種分析方法，其不僅僅是詞法分析和句法分析這樣語(yǔ)法水平上的分析，而是涉及到了單詞、詞組、句子、段落所包含的意義。其目的是從句子的語(yǔ)義結(jié)構(gòu)表示言語(yǔ)的結(jié)構(gòu)。中文語(yǔ)義分析方法是基于語(yǔ)義網(wǎng)絡(luò)的一種分析方法。語(yǔ)義網(wǎng)絡(luò)則是一種結(jié)構(gòu)化的，靈活、明確、簡(jiǎn)潔的表達(dá)方式。

4、語(yǔ)用分析

語(yǔ)用分析相對(duì)于語(yǔ)義分析又增加了對(duì)上下文、語(yǔ)言背景、環(huán)境等的分析，從文章的結(jié)構(gòu)中提取到意象、人際關(guān)系等的附加信息，是一種更高級(jí)的語(yǔ)言學(xué)分析。它將語(yǔ)句中的內(nèi)容與現(xiàn)實(shí)生活的細(xì)節(jié)相關(guān)聯(lián)，從而形成動(dòng)態(tài)的表意結(jié)構(gòu)。

5、語(yǔ)境分析

語(yǔ)境分析主要是指對(duì)原查詢語(yǔ)篇以外的大量“空隙”進(jìn)行分析從而更為正確地解釋所要查詢語(yǔ)言的技術(shù)。這些“空隙”包括一般的知識(shí)，特定領(lǐng)域的知識(shí)以及查詢用戶的需要等。它將自然語(yǔ)言與客觀的物理世界和主觀的心理世界聯(lián)系起來(lái)，補(bǔ)充完善了詞法、語(yǔ)義、語(yǔ)用分析的不足。

四、?Ai對(duì)話目前存在的問題

人機(jī)對(duì)話過程中，用戶難免會(huì)出現(xiàn)表達(dá)失誤的情況，導(dǎo)致機(jī)器對(duì)用戶語(yǔ)言理解出現(xiàn)偏差，在這時(shí)，糾錯(cuò)機(jī)制對(duì)機(jī)器而言則非常重要，如缺少這個(gè)機(jī)制，用戶需要花費(fèi)相當(dāng)長(zhǎng)的時(shí)間將其意圖解釋清楚，相應(yīng)的用戶體驗(yàn)也會(huì)十分糟糕。另一方面，雖然可以很好的識(shí)別語(yǔ)音，但是卻不能理解你的對(duì)話目的，語(yǔ)義理解上有偏差。

當(dāng)前，包括Alexa在內(nèi)的國(guó)內(nèi)外智能音箱之所以沒有表現(xiàn)的那么智能，出現(xiàn)了“人工智障”的嘲笑也是因?yàn)樵谝陨蟽煞矫鏇]有處理太好。

因此語(yǔ)音交互最終需要解決的關(guān)鍵問題是歧義消解問題，和未知語(yǔ)言現(xiàn)象的處理問題。

五、?智能語(yǔ)音助手背后的生態(tài)服務(wù)

Amazon Echo 的勝利在于其語(yǔ)音助手 Alexa 掌握的無(wú)數(shù)技能，Google Assistant 以及Google Home之所以被人看好是在于其 Android 后發(fā)優(yōu)勢(shì)所具備的開放性。

智能語(yǔ)音助手類的產(chǎn)品要想在中國(guó)落地開花，它不僅僅是簡(jiǎn)單的語(yǔ)音識(shí)別那么簡(jiǎn)單，還有集成服務(wù)，一整套的中文生態(tài)、內(nèi)容、服務(wù)等配套設(shè)施，是一種涵蓋很多基礎(chǔ)能力的生態(tài)系統(tǒng)。

未來(lái)基于語(yǔ)音交互的語(yǔ)義技能，必須要能夠達(dá)到幾萬(wàn)、幾十萬(wàn)甚至上百萬(wàn)種的時(shí)候，才能促使語(yǔ)音交互時(shí)代操作系統(tǒng)真正走向成熟，未來(lái)語(yǔ)音交互產(chǎn)品的形態(tài)和樣式也將越來(lái)越豐富。

讓我們期待未來(lái)Ai語(yǔ)音交互的蓬勃發(fā)展，期待未來(lái)對(duì)技術(shù)的無(wú)限挑戰(zhàn)！

本文由 @?Baolan 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自PEXELS，基于CC0協(xié)議

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App