Carbon Forum » hadoop小学生
hadoop小学生

用户名:hadoop小学生

注册于:2018-09-13

主题数: 33     回贴数: 1

网站:

介绍:
IT互联网从业者,专注hadoop、hanlp中文自然语言、电商营销等领域

最后活动于2 天前
回复了主题  › 学hadoop需要什么基础

«  2018-09-26
创建了主题  › 大数据平台开发公司有哪?

大数据、区块链可以说近几年互联网非常火爆的风口了,发展真可谓是蓬勃向上。围绕大数据进行的行业变革、创新已经不仅仅是趋势,而是真实在进行中。大数据技术对各行业的重要性不言而喻,15

«  2 天前
创建了主题  › Hanlp分词实例:Java实现TFIDF算法


算法介绍

«  2 天前
«  4 天前
创建了主题  › Sprk应用HanLP对中文语料进行文本挖掘--聚类详解教程

软件:IDEA2014、

«  4 天前
创建了主题  › 自然语言处理之:搭建基于HanLP的开发环境

环境搭建比FNLP的简单,具体参考:

«  7 天前
创建了主题  › 基于hadoop的免费大数据平台有哪些?

早些时候(5月28号

«  9 天前
创建了主题  › hanlp源码解析之中文分词算法详解

词图

«  9 天前
创建了主题  › 城市智慧停车系统方案的产品设计体系介绍

最近几年随着大数据技术快速发展与应用,智慧城市随即被正式提出。而且,我们也可以深刻感受到“智慧”正在慢慢改变我们的生活方式和城市。要让城市变智慧的地方太多太多,当前我们接触做多的可能就是外出停车,比如很多商场的停车系统,很多商城的停车场都实现

«  11 天前
创建了主题  › HanLP 关键词提取算法分析详解

l 参考论文:《TextRank: Bringing Order into Texts》

«  11 天前
创建了主题  › DKH企业级大数据解决方案的优势分析

大数据技术的发展与应用已经在深刻地改变和影响我们的日常生活与工作,可以预见的是在大数据提升为国家战略层面后,未来的几年里大数据技术将会被更多的行业应用。

«  14 天前
创建了主题  › HanLP用户自定义词典源码分析详解


1. 官方文档及参考链接

«  14 天前
创建了主题  › DKhadoop大数据平台基础框架方案概述

大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了。如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉。大数据作为当下最为重要的一项战略资源,已经是越来越得到国家和企业的高度重视,我们从大数据被上升到国家战略层面就可窥见一二!

«  16 天前
创建了主题  › Python中调用自然语言处理工具HanLP手记

HanLP方法封装类:

1. # -*- coding:utf-8 -*-

2. # Filename: main.py

3.

4.from jpype import *

5. 

5.startJVM(getDefaultJVMPath(), "-Djava.class.path=C:\hanlp\hanlp-1.3.2.jar;C:\han

«  16 天前
创建了主题  › HanLP的人名识别分析详解


在看源码之前,先看几遍论文《基于角色标注的中国人名自动识别研究》

«  18 天前
创建了主题  › 自然语言处理中的分词问题总结

众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。本文

«  21 天前
创建了主题  › Hanlp实战HMM-Viterbi角色标注中国人名识别


这几天写完了人名识别模块,与分

«  25 天前
创建了主题  › DKHadoop大数据开发框架的构成模块

大数据也不是近几年才出现的新东西,只是最近几年才真正意义上变得热门、火爆!而这要得益于互联网信息技术的快速发展,网络改变世界、改变生活,大数据技术的应用让这样的改变更为深刻。

«  28 天前
创建了主题  › Hanlp中使用纯JAVA实现CRF分


与基于隐马尔可夫模型的最短路径分词、N-

«  28 天前
创建了主题  › DKHadoop大数据平台架构详解


«  30 天前
创建了主题  › 依存句法分析器的简单实现

生成式句法分析指的是,生成一系列依存句法树,从它们中用特定算法挑出概率最大那一棵。句法分析中,生成模型的构建主要使用三类信息:词性信息、词汇信息和结构信息。前二类很好理解,而结构信息需要特殊语法标记,不做考虑。

«  30 天前
«  2018-10-15
创建了主题  › DKHadoop的集群环境部署说

Hadoop集群环境搭建是很多学习hadoop

«  2018-10-12
创建了主题  › Hanlp等七种优秀的开源中文分词库推荐


中文分词是中文文本处理的基础步骤,也是中文人机自然语言交互的基础模块。由于中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词。

«  2018-10-12
创建了主题  › 机器学习的趋势和人工智能的未来


每家公司现在是一个数据公司,在一定范围能够使用机器学习在云中部署智能应用程序,这归功于三个机器学习的趋势:

«  2018-10-10
创建了主题  › HanLP代码与词典分离方案与流程


之前在spark环境中一直用的是portable版

«  2018-10-10
创建了主题  › Elasticsearch集成HanLP分词器


1、通过git

«  2018-10-08
创建了主题  › 区块链在零售业和银行业的广泛应用

区块链在零售业和银行业的广泛应用

«  2018-10-08
创建了主题  › 菜鸟如何使用hanlp做分词的过程记录

菜鸟如何使用hanlp做分词的过程记录

«  2018-09-30
创建了主题  › Hadoop应用案例分析:P2P借款人信用风险实时监控模型设计

一提到hadoop相信熟悉IT领域或者经常关注互联网新闻的朋友都应该很熟悉了,当然,这种熟悉可能也只是听着名字耳熟,但并不知道它具体是什么东西,或者用来做什么。这些都不重要,重要的是你知道有hadoop这么个东西就可以了。

«  2018-09-29
登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤ICP备17135490号-1