1978年到2017年政府工作報告關(guān)鍵詞盤點
3月5日,第十二屆全國人民代表大會第五次會議在北京人民大會堂開幕。國務(wù)院總理李克強作政府工作報告。澎湃新聞(thepaper.cn)整理了中國政府網(wǎng)上1978年至2017年共計40份《政府工作報告》中的常青詞匯。結(jié)果顯示,“發(fā)展”、“建設(shè)”、“經(jīng)濟”、“改革”等詞語在過去40年中一直高頻出現(xiàn)。
還有部分詞語愈發(fā)頻繁地出現(xiàn)在《政府工作報告》中。“創(chuàng)新”,1997年后開始被頻頻提起,因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”,類似的詞語還有“就業(yè)”、“創(chuàng)業(yè)”、“民生”等。
澎湃新聞還對比了部分關(guān)鍵詞在這40年間的'趨勢變化,“農(nóng)業(yè)”與“工業(yè)”相比,在近四十年里被提及狀況相對穩(wěn)定,這與長期以來三農(nóng)問題備受重視的現(xiàn)象相關(guān)。2000年以來,“制造業(yè)”與“服務(wù)業(yè)”幾乎同時開始被提及,但是“服務(wù)業(yè)”的被提及率幾乎都高于“制造業(yè)”。
有些詞雖然在《政府工作報告》里出現(xiàn)得少,但是他們首次出現(xiàn)的時間點都反映了當年中國人關(guān)注的熱點問題。
————————————
分析方法:
1.本文所有原始文本材料來自中國政府網(wǎng)1978年至2017年政府工作報告。
2.本文使用jieba分詞(https://github.com/fxsjy/jieba/),其自稱”做最好的 Python 中文分詞組件“。采用精確分詞模式,避免重復(fù)分詞和歧義。分詞結(jié)果均去掉數(shù)字、單字、標點符號。
3.為增加分詞正確率,在jieba分詞的基礎(chǔ)上加入自定義詞典,自定義詞典主要包含了往年人民網(wǎng)和新華網(wǎng)統(tǒng)計的兩會熱詞。
4.在分詞基礎(chǔ)上,采用TF-IDF加權(quán)技術(shù)。詞語的重要性隨著它在文本中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。本文使用的語料庫即1978年至2017年政府工作報告文本。
5.涉及合并的詞語:反腐包括了反腐倡廉、反腐敗、腐敗、反腐;城鎮(zhèn)包括了城市、城鎮(zhèn);霧霾包括了PM2.5、霧霾。
【1978年到2017年政府工作報告關(guān)鍵詞盤點】相關(guān)文章:
本文來源:http://www.nvnqwx.com/gongwen/gongzuojihua/3225698.htm