HTML冗余代码清除
更新时间:2023-10-17 19:31:01 阅读量: 综合文库 文档下载
- 折叠冗余代码推荐度:
- 相关推荐
///
/// 清理Word生成的冗余HTML ///
///
public static string CleanWordHtml(string html) {
StringCollection sc = new StringCollection(); // get rid of unnecessary tag spans (comments and title) sc.Add(@\ sc.Add(@\ // Get rid of classes and styles sc.Add(@\ sc.Add(@\ // Get rid of unnecessary tags
//sc.Add(@\ sc.Add(@\ // Get rid of empty paragraph tags sc.Add(@\
// remove bizarre v: element attached to tag sc.Add(@\ // remove extra lines sc.Add(@\ foreach (string s in sc) {
html = Regex.Replace(html, s, \ }
return html; }
================================================================================
从word粘贴时冗余HTML代码过滤增强版
后台日志编辑默认的编辑器貌似不支持从word粘贴功能,无奈换上了最新的
kindeditor3.5.1,过滤功能很强大。赞!不过还是剩下一些没用的。吃流量,不环保。自己动手增强了一把,做法如下,感兴趣的也可以照此自己改改这一块(改之前务必备份原来的文件!!!):
1、kindeditor.js(3.5.1版)的3236行,“//add start”和“//add end”之间是我加的代码。
1. KE.plugin['wordpaste'] = { 2. click : function(id) { 3. KE.util.selection(id); 4. this.dialog = new KE.dialog({ 5. id : id,
6. cmd : 'wordpaste', 7. file : 'wordpaste.html', 8. width : 450, 9. height : 300, 10. loadingMode : true,
11. title : KE.lang['wordpaste'], 12. yesButton : KE.lang['yes'], 13. noButton : KE.lang['no'] 14. });
15. this.dialog.show(); 16. },
17. exec : function(id) {
18. var dialogDoc = KE.util.getIframeDoc(this.dialog.iframe); 19. var wordIframe = KE.$('wordIframe', dialogDoc);
20. var str = KE.util.getIframeDoc(wordIframe).body.innerHTML; 21. str = str.replace(//ig, \
22. str = str.replace(//ig, \
23. str = str.replace(/