人工智能剛上崗就"翻車" 培養(yǎng)一名合格的AI編輯總共分幾步

　　日前，微軟宣布6月底擬裁撤近80名外包編輯，由AI編輯負(fù)責(zé)接下來的MSN網(wǎng)站的新聞抓取、排版和配圖等工作。但沒想到，剛到崗沒多久，AI編輯就“翻車”了，而且犯了一個(gè)非常低級(jí)的錯(cuò)誤。AI編輯在尋找配圖的時(shí)候，把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。

　　針對(duì)此次微軟AI的配圖錯(cuò)誤事件，Jade也在社交媒體上表達(dá)了不滿：“正常區(qū)分兩個(gè)不同膚色的人有那么難嗎？”為何一向以高識(shí)別率著稱的AI，這次卻“翻車”了？

　　解決臉盲問題需要不斷擴(kuò)大學(xué)習(xí)范圍

　　人臉識(shí)別技術(shù)是目前AI領(lǐng)域公認(rèn)的比較成熟的技術(shù)，圈內(nèi)人士也熱衷像刷分一樣把人臉識(shí)別準(zhǔn)確率屢屢刷出新高，最高的號(hào)稱準(zhǔn)確率可達(dá)99.9%。人臉識(shí)別技術(shù)有如此輝煌的戰(zhàn)績，為何此次AI編輯還會(huì)臉盲呢？

　　“人臉識(shí)別技術(shù)的工作原理，主要是比對(duì)五官比例以及面部特征�！碧旖虼髮W(xué)智能與計(jì)算學(xué)部教授韓亞洪解釋，簡單說，就是基于人臉圖像的大數(shù)據(jù)，先對(duì)看到的人臉圖像進(jìn)行預(yù)處理，提取面部各個(gè)方面的特征，并通過分層多次提取，尋找對(duì)于識(shí)別個(gè)體人臉最有效的特征表達(dá)。

　　人臉識(shí)別技術(shù)這些年已經(jīng)發(fā)生了重大的變化，傳統(tǒng)的人臉識(shí)別方法已經(jīng)被基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法替代。深度學(xué)習(xí)方法的主要優(yōu)勢是它們可通過大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練，從而學(xué)習(xí)到這些數(shù)據(jù)的最佳特征。

　　“雖然可以使用大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練，但是目前99.9%的準(zhǔn)確率，基本上是在一些基準(zhǔn)的數(shù)據(jù)集上測試的結(jié)果。這個(gè)數(shù)據(jù)集肯定是有范圍的，如果收集的數(shù)據(jù)是在數(shù)據(jù)集分布的范圍內(nèi)，便可獲得比較高的準(zhǔn)確率�！表n亞洪說。

　　據(jù)了解，目前號(hào)稱人臉識(shí)別準(zhǔn)確率達(dá)到99%以上的，很多指的都是和全世界最權(quán)威的人臉數(shù)據(jù)庫LFW（Labeled Faces in the Wild）進(jìn)行比對(duì)測試的成績。LFW可以被認(rèn)作一個(gè)考查深度學(xué)習(xí)系統(tǒng)人臉識(shí)別能力的題庫。它從互聯(lián)網(wǎng)上提取6000張不同朝向、表情和光照環(huán)境的人臉照片作為考題，可以讓任何系統(tǒng)在里面“跑分”。“跑分”過程是LFW給出一對(duì)照片，詢問測試系統(tǒng)兩張照片是不是同一個(gè)人，系統(tǒng)給出yes或no的答案。

　　“解決特定的臉盲問題并不難，其實(shí)就是重新針對(duì)任務(wù)，收集這項(xiàng)任務(wù)領(lǐng)域內(nèi)的人臉圖像，在原有算法模型上訓(xùn)練，或者重新設(shè)計(jì)新的算法模型進(jìn)行訓(xùn)練，都會(huì)提高人臉識(shí)別率，以滿足實(shí)際應(yīng)用的需求。”韓亞洪說，但是超出了特定任務(wù)，AI的“臉盲癥”就會(huì)復(fù)發(fā)。目前并沒有哪個(gè)通用的模型算法可以解決所有的任務(wù)，但是AI可以通過不斷地調(diào)整，大量的學(xué)習(xí)，從而提高人臉識(shí)別的準(zhǔn)確性。

　　深度神經(jīng)網(wǎng)絡(luò)模型是進(jìn)階的必要條件

　　“目前針對(duì)新聞文檔的分析和處理任務(wù)，AI編輯做起來相對(duì)得心應(yīng)手�！表n亞洪介紹，具體地說，比如在一篇很長的報(bào)道中，讓AI編輯把重點(diǎn)摘出來，這是沒有問題的�，F(xiàn)在是多媒體時(shí)代，大量的新聞報(bào)道會(huì)涉及圖片和視頻，AI編輯可以將圖片或者視頻自動(dòng)提取出來，再從大篇幅的文字報(bào)道中，選取與之相匹配的文字說明，這個(gè)工作AI是可以比較準(zhǔn)確地做到的。

　　“解決特定領(lǐng)域的問題，AI大多時(shí)候還是沒問題的，但是要實(shí)現(xiàn)通用，就比較難了�！表n亞洪強(qiáng)調(diào)，實(shí)現(xiàn)這些功能需要用到自然語言處理、模式識(shí)別、圖像視頻理解等領(lǐng)域的技術(shù)。

　　要培養(yǎng)一名AI編輯，首先需要收集大量的新聞報(bào)道和圖片視頻，再根據(jù)收集到的數(shù)據(jù)設(shè)計(jì)一個(gè)針對(duì)這個(gè)任務(wù)的深度神經(jīng)網(wǎng)絡(luò)模型，網(wǎng)絡(luò)模型里會(huì)有很多參數(shù)，然后通過數(shù)據(jù)把參數(shù)訓(xùn)練出來，它就具備了最初設(shè)定的各種編輯能力了。在使用過程中，隨著AI編輯學(xué)習(xí)了更多的新聞，它的業(yè)務(wù)能力和性能也將不斷提升。

　　“不過目前的新聞生產(chǎn)對(duì)于AI編輯來說還很困難�！表n亞洪說，要讓AI學(xué)會(huì)寫新聞，必須要針對(duì)某個(gè)特定新聞主題，進(jìn)行大量資料搜集和模型訓(xùn)練。目前AI技術(shù)只能在風(fēng)格相對(duì)固定、詞匯量使用范圍較小的領(lǐng)域完成文本生成，比如天氣預(yù)報(bào)等內(nèi)容，AI可以很好地輸出相關(guān)報(bào)道和消息。但要生成人類創(chuàng)作的那種有創(chuàng)新要求、情感描述豐富的文章，AI編輯的能力仍有待進(jìn)一步提升。

　　協(xié)作將使新聞生產(chǎn)更加高效

　　“有趣的是，AI犯的錯(cuò)誤大多是我們意想不到的低級(jí)錯(cuò)誤，但在某些方面又強(qiáng)悍到讓人類望塵莫及�！表n亞洪舉例說，像給文章分類這種工作，人類編輯要進(jìn)行大量閱讀，重復(fù)性勞動(dòng)耗時(shí)耗力，速度非常慢。但這項(xiàng)工作AI編輯做起來就非常簡單了，通過文字—文檔的主題建模，AI可以比較準(zhǔn)確地對(duì)文章按主題進(jìn)行分類。另外，對(duì)于可以使用模板的短新聞，比如天氣預(yù)報(bào)、證券信息等，AI編輯可以準(zhǔn)確迅速地將各種數(shù)字或者專有名詞嵌套到模板中，從而完成一定的文檔生成任務(wù)。

　　美聯(lián)社曾使用AI系統(tǒng)自動(dòng)編發(fā)企業(yè)財(cái)報(bào)。AI系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)抓取，將其嵌套在美聯(lián)社預(yù)先設(shè)定的新聞模板中，幾秒鐘就能完成一篇150—300字的短消息，該系統(tǒng)每季度能產(chǎn)出約4000篇新聞，與之相比，美聯(lián)社的人工編輯們每季度只能完成400篇。

　　做這些特定的工作，AI編輯比人類厲害的地方不僅在于速度，準(zhǔn)確率也可圈可點(diǎn)�！跋穹诸惢蛘呤乔短啄０鍖懚滔⑦@類的工作，因?yàn)槿蝿?wù)明確，AI的準(zhǔn)確率還是非常高的，很少出現(xiàn)錯(cuò)別字或者數(shù)據(jù)錯(cuò)誤�！表n亞洪介紹。

　　在運(yùn)用大數(shù)據(jù)分析預(yù)測爆款方面，AI編輯可能比人類單純從經(jīng)驗(yàn)出發(fā)顯得更“科學(xué)”。2015年，《紐約時(shí)報(bào)》使用AI機(jī)器人對(duì)社交平臺(tái)中的文章進(jìn)行篩選和分析，預(yù)測哪部分內(nèi)容適合推廣。凡是由它自動(dòng)推薦的文章的點(diǎn)擊量都大大增加，甚至達(dá)到了普通文章的38倍。

　　“但在AI編輯的世界中，只有知道和不知道兩種狀態(tài)，因此處理的內(nèi)容一旦超綱，它們就會(huì)立刻犯很多低級(jí)到可笑的錯(cuò)誤�！表n亞洪說，像這次AI編輯把非裔的Leigh跟阿拉伯裔的Jade弄混了的這樣的錯(cuò)誤，對(duì)于人類來說，即使沒見過Leigh ，但根據(jù)常識(shí)，也不會(huì)把非洲裔和阿拉伯裔弄混。

　　“目前階段的編輯工作完全依賴AI是不現(xiàn)實(shí)的，讓AI成為人類編輯的幫手似乎更切實(shí)可行�！表n亞洪說。美聯(lián)社預(yù)測，AI介入媒體行業(yè)能夠幫助新聞工作者釋放20%左右的時(shí)間，讓后者可以將這部分時(shí)間更多地投入到內(nèi)容創(chuàng)作方面，簡單的事實(shí)核查與調(diào)研方面的工作交給AI，有利于提高新聞質(zhì)量。

　　“未來，人類應(yīng)該把AI編輯當(dāng)作合作伙伴，雙方協(xié)同起來，使工作更加高效有質(zhì)量。”韓亞洪說，人類不應(yīng)該覺得AI是來“搶飯碗”的，而應(yīng)該為有AI這樣的合作伙伴而感到幸運(yùn)。（記者陳曦）

国产黄色大片在线观看,怡红院在线观看在线视频,国产视频高清在线,国产男女在线观看,美女下面直流白浆视频,婷婷在线观看视频,国产永久免费视频m3u8

人工智能剛上崗就"翻車" 培養(yǎng)一名合格的AI編輯總共分幾步

人工智能剛上崗就"翻車" 培養(yǎng)一名合格的AI編輯總共分幾步