标签:补齐标签

补齐HTML标签

发表于1年前(Feb 25, 2017 2:10:33 PM)  阅读 620  评论 0

分类: Java

标签: htmlparse 补齐标签 CompositeTag

在一些博客系统中,非文章阅读页面一般不会显示文章的文章内容,一般是显示文章的摘要信息,而摘要信息的生成,有些系统是由用户自行编辑,而有些系统是通过正文截取的。如果通过截取方式,我们代码一般很难将文章截取得恰到好处,主要是字面断字困难,只能设定截取多少个字符,而内容一般是富文本,即包含html标签,通过字数方式截取,可能将一些html标签从中打断,导致原来的富文本内容html标签不完整,而展现时浏览器会尝试修复,自动补齐丢失的标签,从而造成页面显示异常。

如何解决上面的问题呢,笔者一般通过两种方式解决。一个就是显示摘要时,将所有的html标签都去除显示,这样自然简单很多,但这只适用于小段文本,摘要比较短的情况,试想如果很长一段摘要,无格式显示,对阅读者肯定会造成反感。其次就是补齐html标签,它不是丢了几个标签吗,我们人为给他补上呗。