python去除html标签详解编程语言

python去除html标签,自己写的,若有不足请指正:

#! /usr/bin/env python 
#coding=utf-8 
# blueel 2013-01-19 
from HTMLParser import HTMLParser 
   
class MLStripper(HTMLParser): 
    def __init__(self): 
        self.reset() 
        self.fed = [] 
    def handle_data(self, d): 
        self.fed.append(d) 
    def get_data(self): 
        return ''.join(self.fed) 
   
def strip_tags(html): 
    s = MLStripper() 
    s.feed(html) 
    return s.get_data()

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/8329.html

(0)
上一篇 2021年7月18日
下一篇 2021年7月18日

相关推荐

发表回复

登录后才能评论