Carbon Forum » hadoop小学生
hadoop小学生

用户名:hadoop小学生

注册于:2018-09-13

主题数: 77     回贴数: 3

网站:

介绍:
IT互联网从业者,专注hadoop、hanlp中文自然语言、电商营销等领域

最后活动于6 小时前
«  2019-02-15
回复了主题  › 如何使用Hanlp加载大字典
«  2019-01-23
回复了主题  › 学hadoop需要什么基础

«  2018-09-26
创建了主题  › Hanlp1.7版本的新增功能一览


Hanlp1.7版本在去年下半年的时候就随大快的DKH1.6版本同时发布了,截至目前1.7大版本也更新到了1.7.1了。本篇分别就1.7.0和1.7.1中新增的功能做一个简单的汇总介绍。

«  6 小时前
创建了主题  › Hanlp汉字转拼音使用python调用详解


1、hanlp简介

«  2 天前
创建了主题  › 如何在hanlp词典中手动添加未登录词

我们在使用hanlp词典进行分词的时候,难免会出现分词不准确的情况,原因是由于内置词典中并没有收录当前的这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作,下面我们就看一下具体的步骤

«  4 天前
创建了主题  › Hanlp自然语言处理中的词典格式说明


使用过hanlp的都知道hanlp中有许多词典,它们的格式都是非常相似的,形式都是文本文档,随时可以修改。本篇文章详细介绍了hanlp中的词典格式,以满足用户自定义的需要。

«  7 天前
创建了主题  › 中文分词算法工具hanlp源码解析


词图

 

«  9 天前
创建了主题  › Window离线环境下如何安装pyhanlp


Hanlp在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装hanlp的。我们可以一起来学习一下!

«  14 天前
创建了主题  › 如何编译运行HanLP自然语言处理包

 

master分支

«  16 天前
创建了主题  › 如何在linux服务器上使用hanlp


关于如何在linux服务器上使用hanlp

«  18 天前
创建了主题  › hanlp提取文本关键词的使用方法记录

本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下!

«  21 天前
创建了主题  › 开源自然语言处理工具包hanlp中CRF分词实现详解

CRF简介

CRF是序列标注场景中常用的模型,比HMM

«  23 天前
创建了主题  › hanlp和jieba等六大中文分工具的测试对比

本篇文章测试的哈工大LTP、中科院计算所NLPIR

«  24 天前
创建了主题  › Java利用hanlp完成语句相似度分析的案例详解

 

分享一篇hanlp分词工具使用的小案例,即利用hanlp

«  27 天前
创建了主题  › pyhanlp文本分类与情感分析


语料库

本文语料库特指文本分类语料

«  2019-02-20
创建了主题  › 自然语言处理工具hanlp关键词提取图解TextRank算法

看一个博主(亚当-adam)的关于hanlp关键词提取算法TextRank的文章,还是非常好的一篇实操经验分享,分享一下给各位需要的朋友一起学习一下!

«  2019-02-20
创建了主题  › Hanlp分词之CRF中文词法分析详解


这是另一套基于CRF的词法分析系统,类似感知机词法分析器,提供了完善的训练与分析接口。

«  2019-02-18
创建了主题  › NLP自然语言处理中的hanlp分词实例


本篇分享的依然是关于hanlp的分词使用,文章内容分享自 gladosAI 的博客,本篇文章中提出了一个问题,hanlp分词影响了实验判断结果。为何会如此,不妨一起学习一下 glad

«  2019-02-18
创建了主题  › Pyhanlp自然语言处理中的新词识别


新词发现

«  2019-02-15
创建了主题  › 中文自然语言处理工具HanLP源码包的下载使用记录


这篇文章主要分享的是

«  2019-02-15
创建了主题  › 中文自然语言处理工具hanlp隐马角色标注详解

本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如C

«  2019-02-13
创建了主题  › 自然语言处理工具python调用hanlp中文实体识别


Hanlp作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于hanlp这款分词工具还是很认可的。本篇继续分享一篇关于hanlp的使用实例即Python调用hanlp进行中文实体识别。

«  2019-02-13
创建了主题  › 自然语言处理工具hanlp自定义词汇添加图解


过程分析

«  2019-01-27
创建了主题  › DKHadoop开发环境安装常见问题及解决方案汇总


Dkhadoop版本的下载安装以及运行环境搭建等各个方面内容基本都已经分享过了,今天给大家就dkhadoop开发环境安装中常见的问题以及解决方法进行

«  2019-01-25
创建了主题  › 实用贴:hadoop系统下载安装教程


在前几篇的文章中分别就虚拟系统安装、LINUX系统安装以及hadoop运行服务器的设置等内容写了详细的操作教程,本篇分享的是hadoop的下载安装步

«  2019-01-25
创建了主题  › 在Hanlp词典手动添加未登录词的方式介绍


在使用Hanlp词典进行分词的时候,会出现分词不准的情况,原因是内置词典中并没有收录当前这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作呢,

«  2019-01-25
创建了主题  › 超详细hadoop集群服务器安装配置教程


虚拟机以及Linux系统安装在之前的两篇分享中已经详细的介绍了方法,并且每一步的都配图

«  2019-01-23
创建了主题  › 如何使用Hanlp加载大字典

 

«  2019-01-23
创建了主题  › spark集群使用hanlp进行分布式分词操作说明


本篇分享一个使用hanlp分词的操作小案例,即在spark集群中使用hanlp完成分布式分词的操作,文章整理自【

«  2019-01-21
登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤ICP备17135490号-1