【附錄】利用文字剖析結果以利製作blacklist

0
如附錄1提到的檔案存放路徑,文字剖析的文字結果會存在:
[ 專檔資料夾 ] / Workspaces / EMWS1(對應的流程圖) / textparsing_terms.sas7bdat
p12
可藉由此表做一些篩選的動作篩選出blacklist的字詞,以下為幾個可能用到的函數:
-         KCOUNT(string):算string雙位元組字元的個數,可以看做算「中文」的字數
-         LENGTH(string) :算string的長度 (含中英文符號等)
-         COUNT(string, substring):string裡包含substring的個數,
ex: COUNT('基金贖回,「貝萊德中國基金」', '基金')=2
Tags
Share

About Author

SAS Taiwan

SAS 學習資源 : https://blogs.sas.com/content/sastaiwan/

Comments are closed.

Back to Top