Chinese

SAS Taiwan 0
開始進行文字分析

SAS Text Miner在處理文字時是以資料集中的一欄「文字」作為分析對象,若有多欄的角色都是文字,SAS Text Miner會自動判斷字數最多的那欄作為分析對象。若要修改,可在變數選項修改。

SAS Taiwan 0
文字剖析與篩選

當資料匯入後,接下來需要對文章的字詞做剖析以及一些轉換的動作,這個章節將會介紹「文字剖析」和「文字篩選」兩個節點如何達成這些事情。

SAS Taiwan 0
【附錄】匯出的資料匯存在電腦的哪裡

當TM跑出來的結果需要與SAS的其他軟體如EG、VA結合時,需要跑出來的結果表格,此時就需要知道表格在電腦中存放的位置。在下範例中,想知道文字群集節點的結果表格時,點選節點左側選項「匯出的資料」後會看到「表格」欄位,如下圖中的TRAIN表格,該表格就存在

SAS Taiwan 0
【附錄】利用文字剖析結果以利製作blacklist

如附錄1提到的檔案存放路徑,文字剖析的文字結果會存在: [ 專檔資料夾 ] / Workspaces / EMWS1(對應的流程圖) / textparsing_terms.sas7bdat 可藉由此表做一些篩選的動作篩選出blacklist的字詞,以下為幾個可能用到的函數: -         KCOUNT(string):算string雙位元組字元的個數,可以看做算「中文」的字數 -         LENGTH(string) :算string的長度 (含中英文符號等) -         COUNT(string, substring):string裡包含substring的個數, ex: COUNT('基金贖回,「貝萊德中國基金」', '基金')=2

1 15 16 17 18 19 29