中間件產品

線點CKM 文本挖掘套件
幫助用戶從文本數據中獲取有價值的信息和知識,

{ 語義分析 }


  • 中文分詞


  • 詞性標注


  • 詞頻統計


  • 詞法分析


  • 句法分析

{ 文本挖掘 }

  • 相似度計算 通過計算不同文本之間的相似度關系,以文找文。

  • 自動分類 采用深度學習技術,自動分類訓練,實現對于非結構化文本的自動分類。

  • 自動聚類 基于相似性算法的自動聚類技術,發現用戶熱點,知識迅速定位,為搜索提供線索等等。

{ 圖片識別與分類 }

圖片文本識別 基于OCR技術,可對于圖片上的印刷體文字進行識別,識別后轉換為文本存儲,文本識別支持JPG、BMP、PNG、TIF等格式圖片,也支持對于PDF里面的圖片進行識別,識別率高達95%以上。

圖片自動分類,采用深度學習算法,對不同類別的圖片進行識別和訓練,從而達到圖片自動分類的目的。

{ 文本抽取 }


  • 關鍵詞提取


  • 摘要提取


  • 命名實體識別


  • 特征詞提取

鹊桥会走势图