昨日,李彥宏在年后發(fā)了首封內(nèi)部公開信,在他看來,內(nèi)容、服務、金融創(chuàng)新、人工智能都將迎來新時代,有仗打才能有士氣,百度各項業(yè)務需做好準備、打好每一場仗才能找到突破機會,同時還將在內(nèi)部主張更加開放的企業(yè)文化,摒棄經(jīng)驗主義,優(yōu)勝劣汰。以下是公開信全文:

內(nèi)容分發(fā)新時代
首先,是內(nèi)容分發(fā)的新時代。
百度從本質(zhì)上來講,最核心的東西還是在做內(nèi)容的分發(fā)。
我們該分發(fā)什么?早期的時候,互聯(lián)網(wǎng)內(nèi)容是以文字為主要形態(tài)。隨著帶寬環(huán)境越來越好,人們的創(chuàng)造力越來越豐富,開始有了圖片。到今天,其實不僅僅是圖,有一個新的圖片相關(guān)的形式叫做圖集也非常受歡迎,很適合在互聯(lián)網(wǎng)上傳播的內(nèi)容形式。
除了圖片,還有視頻。今天的視頻,我覺得跟過去又有了很大的不一樣。首先是短視頻的這種興起,它適用的場景和觸達到的人群都非常不一樣。我們身處在百度這樣的內(nèi)容分發(fā)的中心,必須要能比別人更早的感知到內(nèi)容分發(fā)環(huán)境的變化才行。
百科是一個很嚴謹?shù)臇|西,但它很早就開始做秒懂視頻,而且是放在詞條的最前面,所以他們對這個內(nèi)容分發(fā)的環(huán)境的敏感度就足夠的高。所以這是我們在迎接新的時代到來的時候要保持的一種思維方式。要對新東西會敏感,什么東西會影響你。
整個世界一直是在變化,從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)起來很多超級app,內(nèi)容越來越多被封裝在微信、微博這些里頭。怎么利用百度的平臺讓內(nèi)容回來、讓我們的用戶能夠方便獲取,完成我們讓人們最便捷平等地獲取信息找到所求的使命?這是在新的時代里我們需要認真思考認真準備并且為之奮斗的東西。
過去這一年我還有一點感受特別深,是社交媒體和自媒體這種環(huán)境下,很多時候人們更多的是在講感情,更多地想傳播他們愿意相信的東西,事實是什么已經(jīng)不重要了。這對我們一個以搜索引擎為核心的公司來說,挑戰(zhàn)也是蠻大的。在這種環(huán)境下,我們怎么來應對,也是一個很大的挑戰(zhàn)。當然,挑戰(zhàn)也意味著機遇。我也希望大家更加主動地去思考這個問題,找到新的屬于我們的機會。
另外一個內(nèi)容我覺得是數(shù)據(jù),數(shù)據(jù)是新的內(nèi)容。在移動互聯(lián)網(wǎng)時代到來以后,數(shù)據(jù)怎么能夠和應用相結(jié)合去呈現(xiàn)一些比較有價值的東西,怎么能夠在我們百度的平臺上把它變成新的內(nèi)容,這也是下一步我們應該著力去做的。
這些結(jié)構(gòu)化的數(shù)據(jù),未來這些東西弄好了之后,它一方面給我們的用戶提供更多有價值的內(nèi)容,另外一方面也是未來我們AI的一個前提。因為AI的技術(shù)需要非常多的數(shù)據(jù)支持,有價值的有序的數(shù)據(jù)越多,你的這個最后出來的結(jié)果就會越好。以至于我們有一個技術(shù)大牛跟我說了一句話:他說數(shù)據(jù)秒殺一切算法。
這一點在現(xiàn)有的很多產(chǎn)品當中已經(jīng)體現(xiàn)出來了,比如百度的語音搜索,大家可以看到識別的準確率已經(jīng)非常非常高了。但是當我們比如說到通用的輸入法去識別這些語音的時候,我們可能還不如市場上某些其他的競爭對手。為什么?因為我們在搜索的這個場景上掌握了比任何人都多的數(shù)據(jù),而這種數(shù)據(jù)是非常非常有特點,有價值的,是別人達不到的。
用戶在進行搜索的時候,其實他在心目中是有比較清晰的需求的,整個過程是一個尋找答案的過程,從最初的需求表達,到他最后找到答案,尤其是在移動互聯(lián)網(wǎng)時代,在手百這樣一個封閉的app里頭,我們能夠track到他的每一步。這就給我們提供了足夠多的訓練的數(shù)據(jù),所以我們可以有很高的識別率。我們不僅僅能夠有很高的語音識別率,實際上整個過程使得我們能夠構(gòu)建出來最好、最豐富的知識庫。我們知道從需求到結(jié)果,到底是一個什么樣子,這些東西都是我們非常有價值的東西。
但是在別的場景里頭,有時候即使你技術(shù)特別好的話呢,可能也不能夠爭得過別人。比如你隨便拍一件商品去識別,淘寶識別出來的結(jié)果,比我們現(xiàn)在拍照搜索的結(jié)果要更加精確。因為大量的商品庫在他那里頭,商家都把數(shù)據(jù)都給標注好了。那么這對我們的啟示是什么?除了我們自己已經(jīng)有的這些個大量豐富的query到最后用戶行為數(shù)據(jù)之外,我們也應該積極的到外頭去找那些對我們有價值的相關(guān)的數(shù)據(jù)。讓他們上到百度的平臺上來,我們利用這些數(shù)據(jù),打磨我們算法,做出最優(yōu)秀的用戶體驗和產(chǎn)品和服務來。
知識圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個人工智能當中非常基礎(chǔ)的構(gòu)件,也是我們相對于其他任何一家公司的優(yōu)勢所在。而且我們從一開始就很重視,未來要更加有意識地根據(jù)我們的需求、場景跟產(chǎn)品,去不斷地豐富,不斷地打磨,不斷地把這個東西做到極致,做到全世界最好。
某種意義上講,我們未來的搜索從索引關(guān)鍵詞的引擎,可能會逐步過渡到索引知識的引擎,它從表面文字的表達和query的匹配,這是上一個時代的事情。下一個時代的事情是用戶真實的需求和我們已經(jīng)積累的知識之間的一種匹配。
還有一個,就是我們現(xiàn)在非常重視的 feed 流產(chǎn)品。過去傳統(tǒng)的搜索是人在找信息,現(xiàn)在要逐漸演進到信息找人。人在沒有主動表達他的信息的時候,我們就已經(jīng)能夠猜出來這是他喜歡的,這是他需要的信息。如何能夠很方便、高效地分發(fā)給這些需要和感興趣的人,這個也是在內(nèi)容分發(fā)形式上一個新的機會和挑戰(zhàn)。我們因為有強大的知識圖譜和用戶畫像,有多年人工智能方面的技術(shù)的積累,有大量的用戶行為和數(shù)據(jù),所以在這方面是非常有優(yōu)勢的。
本文來源:http://www.nvnqwx.com/gongwen/gongkaixin/220235.htm