SAS Text Miner可探索隱藏在大量文字中的資訊。支援多種語言及檔案格式,並且提供豐富的語言與分析模型工具。將不同的非結構化文字片段、文件檔案庫及網頁下載內容,透過演算法自動識別出模式的各種主題,找出詞彙與片語間的顯著關聯。此軟體提供監督、無監督及半監督的方法來探索大量文件中過去未知的模式。
簡單來說,SAS Text Miner可以做到的事情就是:
那麼,SAS Text Miner為什麼重要呢?每天收集大量的文字資訊,例如客戶的建議、電子郵件、網頁文件、部落格、Twitter 文章、保固請求、調查、研究、客戶通知、競爭情報等。沒有人有時間詳閱,更別說將內容分類成共同的主題,或是從中找出重要資訊。此時SAS Text Miner就有很大的用途,它有以下幾項主要優點:
1. 透過自動化程序縮短決策時間:藉由執行智慧演算法與自然語言處理技術,原本耗時的人工作業,如主題識別或主題建立,即可自動產生並以一致且有效的方式執行,節省成本與資源。如以下例子,現在有一千多篇財經類的文章,軟體自動將它分成25主題,一個主題是以前五大代表詞語表示,像是「俄羅斯,石油,烏克蘭,制裁,四國」為一個主題,主題下有46篇相關的文章。
2. 自訂調整以達到更好效果:除了軟體自動化程序外,也可以藉由互動式 GUI 修改相關性分數,引導機器學習人類見解所產生的結果。像是在剛剛提到的主題中,我們覺得「石油」這個詞在這個主題中很重要,便可以手動修改這個詞語的權數。
3. 結果的視覺化分析:以視覺化呈現完整的資料探勘程序,並可讓使用者鑽探相關的詳細內容,以瞭解並探索詞彙的連結。例如「俄羅斯」這個詞常常與「油價」、「烏克蘭」一起出現,它們之間就會有比較大的權重。
4. 識別趨勢並發現商機:將文字以數據方式呈現,可歸納搜集資料的內容,並成為各種預測性與資料探勘建模技術的有效輸入值。如此一來,將能夠更瞭解目前趨勢,並可預測機會以及時掌握。
5. 與其它SAS分析軟體無縫接軌
SAS Text Miner可以應用在SAS Enterprise Miner (EM)資料採礦、SAS Enterprise Guide (EG)或其它SAS軟體上,提供一整套的文字和結構化資料的資料分析、評分及預測的工具。
Tags