怎样提取出一段文本中的目录结构?

By ivanilla at 2017-02-19 • 0人收藏 • 987人看过

比如:

标题1

摘要

标题2

简介

标题3

详细内容

标题4

提取出:

- 1 标题1
-- 1.1 标题2
--- 1.1.1 标题3
- 2 标题4

类似维基百科这样的,而且带书签链接。

如果有相应的扩展包就更好了

6 个回复 | 最后更新于 2017-02-22
2017-02-20   #1

@lincanbin 你有什么好的思路吗?我目前只想到正则匹配(但文本是以markdown格式存储在数据库中的)

2017-02-20   #2

这种无疑是正则匹配,不然就是直接解析DOM树。

2017-02-20   #3

回复#2 @lincanbin :

哪种方法比较好

2017-02-20   #4

回复#3 @ivanilla :

后者,不会遗漏。

2017-02-20   #5

回复#4 @lincanbin :

OK。

2017-02-22   #6

所以大哥你的项目呢?还没有做好呀。

登录后方可回帖

登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤公网安备 44030602003677号
粤ICP备17135490号-1

Loading...