Carbon Forum » hadoop小学生
hadoop小学生

用户名:hadoop小学生

注册于:2018-09-13

主题数: 106     回贴数: 3

网站:

介绍:
IT互联网从业者,专注hadoop、hanlp中文自然语言、电商营销等领域

最后活动于2 天前
«  2019-02-15
回复了主题  › 如何使用Hanlp加载大字典
«  2019-01-23
回复了主题  › 学hadoop需要什么基础

«  2018-09-26
创建了主题  › HanLP-朴素贝叶斯分类预测缺陷

文章整理自 

«  2 天前
创建了主题  › HanLP-地名识别调试方法


 HanLP收词特别是实体比较多,因此特别容易造成误识别。下边举几个地名误识别的例子,需要指出的是,后边的机构名识别也以地名

«  5 天前
创建了主题  › python调用hanlp进行命名实体识别


 本文分享自 6丁一的猫 的博客,主要是python

«  9 天前
创建了主题  › hanlp添加自定义字典的步骤介绍

本篇分享一个hanlp添加自定义字典的方法,供大家参考!

«  12 天前
创建了主题  › Spring MVCD框架中调用HanLP分词的方法

项目简要:关于java web的一个项目,用的Spring MVCd 框架。鉴于参与此次项目的人中并不是所人都做的Spring,为了能够提高效率,建议大家是先抛开SPring来写自己负责的模块,最后再把各个模块在Spring里面集成。

«  14 天前
创建了主题  › java分词工具hanlp介绍


前几天(

«  21 天前
创建了主题  › 基于hanlp的es分词插件


摘要:elasticsearch是使用比较广泛的

«  22 天前
创建了主题  › pyhanlp 繁简转换之拼音转换与字符正则化


繁简转换

HanLP几乎实现了所有

«  26 天前
创建了主题  › 中文分词工具之基于字标注法的分词

基于字标注法的分词

中文分词字标注通常有

«  28 天前
创建了主题  › 自然语言处理工具中的中文分词器介绍


中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性,句法树等模块的效果,当然分词只是一个工具,场景不同,要求也不同。在人机自然语言交互中,成熟的

«  30 天前
创建了主题  › Ansj与hanlp分词工具对比



一、Ansj

«  2019-06-21
«  2019-06-19
创建了主题  › Hanlp配置自定义词典遇到的问题与解决方法

本文是整理了部分网友在配置hanlp自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另一些解决的方案以及思路。这里分享给大家学习参考。

«  2019-06-17
创建了主题  › 如何在java中去除中文文本的停用词

1.  整体思路

第一步:先

«  2019-05-06
创建了主题  › java中利用hanlp比较两个文本相似度的步骤


使用 HanLP - 汉语言处理包 来处理,他能处理很多事情,如分词、调用分词器、命名实体识别、人名识别、地名识别、词性识别、篇章理解、关键词提取、简繁拼音转换、拼音转换、根据输入智能推荐、自定义分词器

«  2019-05-06
创建了主题  › hanlp 加载远程词库示例

说明

·

«  2019-04-26
创建了主题  › HanLP 自然语言处理 for nodejs

·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxE

«  2019-04-24
创建了主题  › HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件,核心功能:

«  2019-04-22
创建了主题  › HanLP vs LTP 分词功能测试


 

文章摘自github,

«  2019-04-19
创建了主题  › HanLP Android 示例

«  2019-04-17
创建了主题  › HanLP中文分词Lucene插件

 基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

«  2019-04-15
创建了主题  › pyhanlp:hanlp的python接口


HanLP的Python接口,支持自动下载与升级HanLP,兼容py2、py3。

«  2019-04-12
创建了主题  › Hanlp自然语言处理工具之词法分析器


本章是接前两篇《分词工具Hanlp基于感知机的中文分词框架》和《基于结构化感知机的词性标注与命名实体识别框架》的。

«  2019-04-10
创建了主题  › 基于结构化感知机的词性标注与命名实体识别框架


上周就关于《结构化感知机标注框架的内容》已经分享了一篇《分词工具Hanlp基于感知机的中文分词框架》,本篇接上一篇内容,继续分享词性标注与命名实体识别框架的内容。

«  2019-04-08
创建了主题  › 分词工具Hanlp基于感知机的中文分词框架



结构化感知机标注框架是一套利用感知机做序列标注任务,并且应用到中文分词、词性标注与命名实体识别这三个问题的完整在线学习框架,该框架利用1个算法解决3个问题,时自治同意的系统,同时三个任务顺序渐进,构成流水线式的系统。本文先介

«  2019-04-03
«  2019-04-02
创建了主题  › 汉语言处理工具pyhanlp的拼音转换与字符正则化

汉字转拼音

HanLP中的汉字转拼音功能也十分的强大。

«  2019-03-29
登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤公网安备 44030602003677号
粤ICP备17135490号-1