信息的挖拙
海量信息今天來傳教~
他們傳教的教義:一個媒體怎么才能更有價值—從掌握信息的發布權到信息的解釋權。
研究了下他們做的東西
如何掌控解釋權,三要素
1,搶抓時效
2,給出解釋
3,價值評說
要支撐上要幾點就要通過信息處理來挖掘信息和信息之間的聯系。
例如下面的一個走勢就可以發現兩者之間有微妙的聯系
現在的現狀是互聯網實現了計算機的互聯,剛剛進入了頁面的互聯,信息內部的互聯怎么發現并聯系起來呢? 計算機讀懂人的語言現在還是很困難的咯。
搜索了些資料,大概了解下分詞的方法。
現在主要的一些途徑是通過語義庫,或者連詞,標點符號來這些來分析統計大概的意思。
如,這些通過語義庫來,詞來替換來讓計算知道大概的意思。
或者這樣通過一些連詞來分析句子的邏輯和語義。
海量的分詞,測試了一下,語義的劃分還比較準確。
在這里http://www.hylanda.com/pro.php?smid=51 可以測試下。
有了分詞,得到以下幾個分類的信息。
然后按地理或者時間,生成信息展示。
1. 跟蹤每天最新人物發表的言論。
http://labs.hylanda.com/2008090100/Oration.htm
2. 檢索指定的某個人發表過的言論。
http://labs.hylanda.com/ori.php?word=%C0%EE%D3%EE%B4%BA&type=0
3. 檢索言論的內容,如:搜索“李宇春”就可以獲得所有對李宇春進行評論的語言和評論人。
http://labs.hylanda.com/ori.php?word=%C0%EE%D3%EE%B4%BA&type=1
還可以加上一些信息設計,讓信息更直觀。
七七八八的堆了一東西,大概了解了下中文信息處理。其實,在這信息經過處理之后,得到了很有語義的信息以后,就是我們的工作范疇了~
怎么把他們可視化的展現出來呢~
來源:http://blog.aloo.cn/2010/08/%E4%BF%A1%E6%81%AF%E7%9A%84%E5%8F%91%E6%8B%99/
- 目前還沒評論,等你發揮!