久久精品一区二区无码_中文字幕乱码熟女免费_一级中文字幕在线播放_直接看黄网站免费无码

不信謠不傳謠 講文明樹新風 網絡安全
首頁 教育 綜合新聞

人工智能訓練師: 讓機器學習“通人性”

2018-12-27 10:18 來源:新華網 責任編輯:yss
發(fā)送短信 zmdsjb 10658300 即可訂閱《駐馬店手機報》,每天1毛錢,無GPRS流量費。

摘要:    人工智能訓練師是一個全新的職業(yè),他們制定數(shù)據(jù)標注規(guī)則,再將數(shù)據(jù)“喂”給機器人,對其進行“調教”、不斷優(yōu)化,讓機器人“通情理、懂人

  

  人工智能訓練師是一個全新的職業(yè),他們制定數(shù)據(jù)標注規(guī)則,再將數(shù)據(jù)“喂”給機器人,對其進行“調教”、不斷優(yōu)化,讓機器人“通情理、懂人性”,更好地為人類服務。

  Shana是追一科技的人工智能訓練師,她以語言學的學科背景“闖進”了人工智能領域,從數(shù)據(jù)標注成長為人工智能訓練師。在工作中,她賦予機器人“人格”,給企業(yè)客服配備了閑聊的服務功能,客戶可以跟它調侃、閑聊,提升機器人寫詩、做對聯(lián)的技能,讓它更通人性。

  Shana是北方人,在北京待了三年攻讀研究生,專業(yè)學的是語言學專業(yè)。在北京讀書的時候,她曾在一家互聯(lián)網巨頭公司有過兩段實習經歷:一段經歷是做產品經理,另一段經歷是做數(shù)據(jù)標注。

  堅決要進互聯(lián)網行業(yè)

  那時是2013年。“當時標數(shù)據(jù)標注是在NLP(自然語言處理)部門做的,算是開始接觸這個行業(yè)。”與局外人認知不同,數(shù)據(jù)標注并不是理工科學生的天下,反而是文科生施展拳腳的舞臺。Shana觀察到,和她一同實習的小伙伴基本上是語言學背景的同學,“因為數(shù)據(jù)標注要求處理數(shù)據(jù)的時候比較細心,甚至有時需要一定的語言學背景知識”。

  當時這份實習更多的是偏重技術性的操作,數(shù)據(jù)標注的規(guī)則已制定好了,實習生按部就班完成,沒有太多主觀能動性發(fā)揮的空間,“數(shù)據(jù)標注基于提供的語料,然后你在語料上做一定的處理,它的一個很重要的規(guī)則就是統(tǒng)一性,所以你不能夠有更多的創(chuàng)造性”。

  她感覺“AI落地生花其實也是兩年前左右的事情”。剛剛畢業(yè),Shana在深圳沒有發(fā)現(xiàn)非常對口的人工智能方面的崗位,偶然的一個契機,她在朋友的推薦下,前往追一科技面試,然后正式開始了數(shù)據(jù)標注的工作,從而打進了理工科學生的領域。

  成為人工智能訓練師

  工作后,Shana正式跨入人工智能領域,那時的她對技術的理解還比較淺。“我只是單純地從興趣出發(fā),我學的是語言學,雖然不想做老師,但我還是希望自己的專業(yè)能夠有所用。”在她看來,數(shù)據(jù)標注是給機器人提供語料,這屬于機器人教育,它不是教人而是教機器人學習某個東西,這與她的專業(yè)相近,能讓她發(fā)揮所長。傳統(tǒng)語言學的研究一直處在一個不溫不火的狀態(tài),但AI的興起讓我覺得傳統(tǒng)語言學有了一個新發(fā)展的方向——怎么樣把語言學研究的成果應用到機器人的教育當中來。這個方向其實也是Shana最感興趣的一個點。

  傳統(tǒng)NLP需要詞性標注、語法樹的標注,這都可以用到語言學的一些東西,雖然用得比較淺,但是在深度學習領域可以怎么用?她也在思考,“最近發(fā)現(xiàn)機器人智能化的表現(xiàn)是趨向于用對話來解決問題,而不是像以前需要點擊屏幕。智能化發(fā)展的一個方向是對話交互,那怎樣可以增加對話的輪次,讓機器好像有了主動意識,從而更好地實現(xiàn)人機交互,可以持續(xù)性地聊下去,這是一個難點”。比如,通過智能客服訂機票或是詢問某只基金的情況,這樣的應用場景就需要開展多輪對話,因為這樣相對復雜的業(yè)務流程不是簡單的對話就能完成的。

  Shana的工作主要是根據(jù)客戶的需求對數(shù)據(jù)進行標注。這通常跟項目有關,有金融類型的,也有互聯(lián)網的企業(yè),也有傳統(tǒng)企業(yè)。她的工作范疇也遠超出數(shù)據(jù)標注,而是跨入人工智能訓練師的全流程作業(yè)——首先要跟客戶對接需求,明確要做一個怎樣的機器人,然后需要跟客戶去溝通訓練機器人語料的問題,這需要保質保量,之后對數(shù)據(jù)進行清洗,再制定規(guī)則進行數(shù)據(jù)標注和訓練機器人,這些都由AI訓練師來做。

  Shana從數(shù)據(jù)標注自然而然轉身成為人工智能訓練師。在她印象中,人工智能訓練師其實也是大概兩年前的時候才誕生的新興職業(yè),剛開始并沒有AI訓練師這個叫法,這個稱呼是從一家互聯(lián)網巨頭公司傳出來的。此后,人工智能訓練師成為特定的一個崗位,這也是大量需求背后促進社會分工進一步細化。

  如今,人工智能訓練師成為一種炙手可熱的新職業(yè),人工智能訓練師赫然出現(xiàn)在許多互聯(lián)網科技公司的招聘名單之中。甚至有城市向人工智能訓練師發(fā)出招賢令,獲得高級專項能力認證的人工智能訓練師有機會申請公租房及落戶加分等政策福利。

  讓機器人更懂人性

  人工智能訓練師的工作說通俗點,就是把機器訓練得更加“通情理、懂人性”,讓它更加適應人類。

  比如關于態(tài)度情緒標注任務,標注類型是情緒厭惡,“我討厭你,你走開”和“哎喲,我討厭你”(這是撒嬌的語氣),中文的文法表達多樣,主體詞組相同,而不同的語氣和聲調可能表達的意思卻有天壤之別。人類很容易辨別,那機器如何通人性,懂得人類的情感呢?

  Shana說,在這個例子中,兩組數(shù)據(jù)很明顯的區(qū)別在于是否有語氣詞,那么針對這個特征可以制定一個規(guī)則。如果將這個案例進一步延伸,可能會有更多類似的表達,但意思可能大不相同,這些人工智能訓練師往往通過詞語和句式兩方面加以區(qū)分。“你要理解機器學習,它最根本的是學習人類的文字表達,它最底層的邏輯就是統(tǒng)計,統(tǒng)計和概率沒有邏輯推理,所以你要從字面上去盡量找區(qū)別特征,其實通過文字特征已經可以解決大量的問題了。”

  讓機器更通人性是人工智能訓練師的重要工作,但現(xiàn)在大背景是目前人工智能還處于弱人工智能時代,在業(yè)界,人工智能訓練師也處于嘗試階段,“像剛剛提到的情感分析,還有怎么樣去賦予一個機器人性格,其實都是可以提升人性的”。Shana說,提升機器人性有兩個層次,好比人跟人對話溝通首先要理解,第二個才是表達。“理解這一塊之于機器人就是識別的準確率,所以訓練的第一步是要先提升識別準確率,機器人先要知道人說的是什么,然后第二步才是表達方式。”具體到客戶需求,她會根據(jù)企業(yè)不同屬性和類別而做不同的訓練,她舉例說,金融行業(yè)的智能客服(機器人)會更加嚴肅一些,而互聯(lián)網企業(yè)可能就會比較活潑,對合作伙伴式表述風格可以更多樣,甚至可以用淘寶體,“所以針對不同的行業(yè)、不同的企業(yè),它的表述的風格是可以不一樣的”。

  為了讓智能客服更通人性,Shana還給企業(yè)客服配備了閑聊的服務功能,客戶可以跟它調侃、閑聊。“你可以問它今天天氣怎么樣,你叫什么名字,你是男生女生等一些比較有意思的問題。”在人工智能訓練師的手筆之下,原本死板的機器增加了人性的感覺和元素,而不是只能回答專業(yè)問題。

  “機器人通過敏感情感識別之后,它會根據(jù)用戶的狀態(tài),做一些情緒安撫。”她說,在這個層次上,機器人對人類語言的理解超越說的話是什么意思,而進入第二層次——理解你的情緒。機器人從人的語音、文字當中感知情緒,甚至感知人話語中是否有敏感的信息。她舉例說,出行行業(yè)的智能客服對車禍這類字眼或者事件會比較敏感,機器人也可以理解客戶的情緒,理解他目前的處境是否有危險。如果他有情緒的話,可以對他進行安撫;如果遇到車禍可以幫他緊急處理。“其實還是非常通情達理的一種方式。”

  “我們的閑聊功能也會不斷增加機器人的一些技能,你為什么喜歡跟這個人交流,其中一個因素就是這個人很博學,假如機器人能夠回答你的問題越多,你會覺得它很聰明,然后愿意跟它交流。”Shana和其他人工智能訓練師會增加機器人寫詩、做對聯(lián)的功能,讓它更通人性。

  文科生在AI領域揮灑才能

  在行業(yè)浸染中,Shana摸爬滾打逐漸淬煉成“老兵”。“成為人工智能訓練師你需要具備數(shù)據(jù)分析能力、熟悉產品能力、溝通能力、對AI技術理解力以及行業(yè)背景知識。”Shana以文科生的身份進入,在工作中不斷去磨練技能,特別是數(shù)據(jù)分析能力。

  目前,Shana“調教”的機器人它主要應用到客戶咨詢、新員工培訓、還款提醒、滿意度回訪等,“客服這個領域就比較確定,它是很明確的一個場景。智能客服應用最多的是金融領域,然后是電商。”

  Shana看好人工智能訓練師的前景。“對這個崗位的需求量肯定是會越來越大的,因為AI時代確實已經到來了,現(xiàn)在全行業(yè)都在嘗試AI怎么樣去落地,怎么樣去跟當前的場景結合,這個結合都離不開技術,離不開數(shù)據(jù),所以對訓練師的需求量肯定會越來越大。同時對訓練師的技能要求也會越來越高。”

  Shana以文科生的身份“闖進”人工智能理工科學生的天地,占據(jù)了一席之地,在人工智能訓練師這樣一個非技術類“新職位”中,文科生有了揮灑才能的機會。

  “技術這一塊確實還是理工科學生的天下,但是為算法模型提供數(shù)據(jù),是文科生更加適合一些,尤其是涉及一些對話交互這種比較細致的工作。”(文、圖/廣州日報全媒體記者 李華)

責任編輯:yss

(原標題:新華網)

查看心情排行你看到此篇文章的感受是:


  • 點贊

  • 高興

  • 羨慕

  • 憤怒

  • 震驚

  • 難過

  • 流淚

  • 無奈

  • 槍稿

  • 標題黨

版權聲明:

1.凡本網注明“來源:駐馬店網”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網書面授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:駐馬店網”。任何組織、平臺和個人,不得侵犯本網應有權益,否則,一經發(fā)現(xiàn),本網將授權常年法律顧問予以追究侵權者的法律責任。

駐馬店日報報業(yè)集團法律顧問單位:上海市匯業(yè)(武漢)律師事務所

首席法律顧問:馮程斌律師

2.凡本網注明“來源:XXX(非駐馬店網)”的作品,均轉載自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如其他個人、媒體、網站、團體從本網下載使用,必須保留本網站注明的“稿件來源”,并自負相關法律責任,否則本網將追究其相關法律責任。

3.如果您發(fā)現(xiàn)本網站上有侵犯您的知識產權的作品,請與我們取得聯(lián)系,我們會及時修改或刪除。

返回首頁
相關新聞
返回頂部