python去除html标签

kkkkk 2018年12月17日 23:07 Python高级

python去除html标签,自己写的,若有不足请指正:

#! /usr/bin/env python
#coding=utf-8
# blueel 2013-01-19
from HTMLParser import HTMLParser
 
class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)
 
def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

调用:

html = '<em productIndex="0" class="valor-dividido" style="display:block"><span>ou <strong><label productIndex="0" class="skuBestInstallmentNumber">12</label>X</strong> de <strong> <label productIndex="0" class="skuBestInstallmentValue">R$  116,58</label></strong> sem juros</span></em>'


print strip_tags(html)


文章评论(0)
  • avatar kkkkkk 2018年12月21日 11:31
    这评论真好啊!
    kkkkk
    2018年12月21日 11:16
    本文独擅胜场之处在于其体现出的作者思维的穿透力与概括性。本文由材料切入,引出观点,并以此为重点展开阐述;同时做辩证分析,体现了作者思维的高度和思考的深入。第三段联系现实概述种种需要“更”的表现,言约而意丰。新颖而有力的论证观点。
    回复
  • avatar kkkkkk 2018年12月21日 11:31
    这评论真好啊!
    kkkkklxinde
    2018年12月21日 11:17
    文章中心明确,内容充实。论证层层推导,步步深入,结构严谨,语言灵动而有质感,张弛有度,开合自如。
    回复
  • avatar kkkkklxinde 2018年12月21日 11:17
    文章中心明确,内容充实。论证层层推导,步步深入,结构严谨,语言灵动而有质感,张弛有度,开合自如。
    回复
  • avatar kkkkk 2018年12月21日 11:16
    本文独擅胜场之处在于其体现出的作者思维的穿透力与概括性。本文由材料切入,引出观点,并以此为重点展开阐述;同时做辩证分析,体现了作者思维的高度和思考的深入。第三段联系现实概述种种需要“更”的表现,言约而意丰。新颖而有力的论证观点。
    回复