Html2Article Html网页正文提取

授权协议:Apache操作系统:Windows 开发语言:C# 查看源码 »
.NET平台下,一个高效的从Html中提取正文的工具。 正文提取采用了基于文本密度的提取算法,支持从压缩的Html文档中提取正文,每个页面平均提取时间为30ms,正确率到95%以上。 Html2...