hadoop小学生 - Carbon Forum

Carbon Forum » hadoop小学生

用户名：hadoop小学生

注册于：2018-09-13

主题数： 115 回贴数： 3

网站：

介绍：
IT互联网从业者，专注hadoop、hanlp中文自然语言、电商营销等领域

最后活动于2019-08-09

回复了主题 › 中文自然语言处理工具HanLP源码包的下载使用记录

111111111111111

« 2019-02-15

回复了主题 › 如何使用Hanlp加载大字典

« 2019-01-23

回复了主题 › 学hadoop需要什么基础

« 2018-09-26

创建了主题 › HanLP封装为web services服务的过程介绍

前几天的召开的2019年大数据生态产业大会不知道大家关注到没有，

« 2019-08-09

创建了主题 › 大快搜索黑科技亮相2019（第四届）大数据产业生态大会

深耕核心技术·

« 2019-08-07

创建了主题 › hanlp分词工具应用案例：商品图自动推荐功能的用

本篇分享一个hanlp

« 2019-08-07

创建了主题 › HanLP分词工具中的ViterbiSegment分词流程

本篇文章将重点讲解HanLP的ViterbiSegment分词器类，而不涉及感知机和条件随机场分词器，也不涉及基于字的分词器

« 2019-08-05

创建了主题 › hanlp自然语言处理包的人名识别代码解析

HanLP发射矩阵词典nr.txt中收录单字姓氏393个。袁义达在《钟国的三大姓氏是如何统计出来的》文献中指出：当代钟国100个常见姓氏中，集中了全国人口的87%，根据这一数据我们只保留nr.txt中的100个常见词语的姓氏角色，其他词语去掉其姓氏角色状态。过滤后，nr.txt中具

« 2019-08-02

创建了主题 › HanLP-命名实体识别总结

人名识别

« 2019-07-31

创建了主题 › Hanlp-地名识别调试方法详解

HanLP收词特别是实体比较多

« 2019-07-29

创建了主题 › 自然语言处理工具HanLP-基于层叠HMM地名识别

本篇接上一篇内容《HanLP-基于HMM-Viterbi的人名识别原理介绍》介绍一下层叠隐马的原理。

« 2019-07-26

创建了主题 › HanLP-基于HMM-Viterbi的人名识别原理介绍

Hanlp自然语言处理包中的基于HMM-Viterbi处理人名识别的内容大概在年初的有分享过这类的文章，时间稍微久了一点，有点忘记了。看了 baiziyu 分享的这篇比我之前分享的要简单明了的多。下面就把文章分享给大家交流学习之用，部分内容有做修改。

« 2019-07-24

创建了主题 › HanLP-朴素贝叶斯分类预测缺陷

文章整理自

« 2019-07-22

创建了主题 › HanLP-地名识别调试方法

HanLP收词特别是实体比较多，因此特别容易造成误识别。下边举几个地名误识别的例子，需要指出的是，后边的机构名识别也以地名

« 2019-07-19

创建了主题 › python调用hanlp进行命名实体识别

本文分享自 6丁一的猫的博客，主要是python

« 2019-07-15

创建了主题 › hanlp添加自定义字典的步骤介绍

本篇分享一个hanlp添加自定义字典的方法，供大家参考！

« 2019-07-12

创建了主题 › Spring MVCD框架中调用HanLP分词的方法

项目简要：关于java web的一个项目，用的Spring MVCd 框架。鉴于参与此次项目的人中并不是所人都做的Spring，为了能够提高效率，建议大家是先抛开SPring来写自己负责的模块，最后再把各个模块在Spring里面集成。

« 2019-07-10

创建了主题 › java分词工具hanlp介绍

前几天（

« 2019-07-03

创建了主题 › 基于hanlp的es分词插件

摘要：elasticsearch是使用比较广泛的

« 2019-07-01

创建了主题 › pyhanlp 繁简转换之拼音转换与字符正则化

繁简转换

HanLP几乎实现了所有

« 2019-06-28

创建了主题 › 中文分词工具之基于字标注法的分词

基于字标注法的分词

中文分词字标注通常有

« 2019-06-26

创建了主题 › 自然语言处理工具中的中文分词器介绍

中文分词是中文文本处理的一个基础步骤，也是中文人机自然语言交互的基础模块，不同于英文的是，中文句子中没有词的界限，因此在进行中文自然语言处理时，通常需要先进行分词，分词效果将直接影响词性，句法树等模块的效果，当然分词只是一个工具，场景不同，要求也不同。在人机自然语言交互中，成熟的

« 2019-06-24

创建了主题 › Ansj与hanlp分词工具对比

一、Ansj

« 2019-06-21

创建了主题 › python使用jieba实现中文文档分词和去停用词

« 2019-06-19

创建了主题 › Hanlp配置自定义词典遇到的问题与解决方法

本文是整理了部分网友在配置hanlp自定义词典时遇到的一小部分问题，同时针对这些问题，也提供另一些解决的方案以及思路。这里分享给大家学习参考。

« 2019-06-17

创建了主题 › 如何在java中去除中文文本的停用词

1. 整体思路

第一步：先

« 2019-05-06

创建了主题 › java中利用hanlp比较两个文本相似度的步骤

使用 HanLP - 汉语言处理包来处理，他能处理很多事情，如分词、调用分词器、命名实体识别、人名识别、地名识别、词性识别、篇章理解、关键词提取、简繁拼音转换、拼音转换、根据输入智能推荐、自定义分词器

« 2019-05-06

创建了主题 › hanlp 加载远程词库示例

说明

« 2019-04-26

创建了主题 › HanLP 自然语言处理 for nodejs

·支持中文分词（N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注），命名实体识别（中国人名、音译人名、日本人名、地名、实体机构名识别），关键词提取，自动摘要，短语提取，拼音转换，简繁转换，文本推荐，依存句法分析（MaxE

« 2019-04-24

创建了主题 › HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件，核心功能：

« 2019-04-22

信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址：Carbon Forum v5.9.0
QQ群：12607708（QQ我不常上）

手机支付宝扫描上方二维码可向本项目捐款