word-wrap和word-break解决连续字符自动换行

网络整理 - 07-27

文本的排版依据语言的不同会有一些格式上的要求,比如简体中文中类似逗号、分号等标点符号不会出现在一行的开头,对于英文来讲就是一个完整单词不会在两行显示,浏览器会依据类似这样的原则来显示文本。但是由于网页有宽度限制的,连续的超长的字母、数字或标点符号超出其所在区域宽度的限制而导致影响页面视觉,如 例1 所示。这个问题在显示用户输入信息时尤为突出,这里就是要说如何解决这个问题。

在CSS3草案中,对文本的处理新增了两个新属性 word-wrap 和 word-break 来解决这个问题:

  • {word-wrap:break-word;} :依照亚洲语言和非亚洲语言的文本规则,允许在字内换行,且允许非亚洲语言文本行的任意字内断开
  • {word-break:break-all;} : 内容将在边界内换行,如需要则词内换行(word-break)也行发生
  • 下面是常见浏览器的支持情况:

      IE Firefox Opera Safari/Chrome

    {word-wrap:break-word;} td元素需设置其宽度
    见 例4 和 例5 不支持 不支持 不支持td元素
    见 例4 和 例5

    {word-break:break-all;} 不支持连续的符号
    见例3 不支持 不支持 支持

    由于{word-break:break-all;}导致英文和数字可读性严重下降且无法使连续符号换行,所以{word-wrap:break-word;}是一个相对较好的选择。

    但面对浏览器的如此糟糕支持,所以不能不借助JavaScript来解决这个问题,即当浏览器不支持CSS解决方案时,在连续字符串的适当位置插入​字符(当然还可以用<wbr>和­,这三个字符在浏览器中的支持情况请看ppk的《The wbr tag》),这些字符写在浏览器中不会显示,却使长字符串换行。具体实现代码如下:

    function fnBreakWordAll(o){
    var o = o || {},
      iWord = o.word || 13,
      iRe = o.re || '[a-zA-Z0-9]',
      bAll = o.all || false,
      sClassName = o.className || 'word-break-all',
      aEls = o.els || (function(){
        var aEls = [],
          aAllEls = document.getElementsByTagName('*'),
          re = new RegExp('(?:^|\\s+)' + sClassName + '(?:\\s+|$)');
        for(var i =0,iLen = aAllEls.length; i < iLen ; ++i){
          if(re.test(aAllEls[i].className)){
            aEls[aEls.length] = aAllEls[i];
          }
        }
        return aEls;
      })() || [],
      fnBreakWord = function(oEl){
        // 基于修改
        if(!oEl || oEl.nodeType !== 1){
          return false;
        }else if(oEl.currentStyle && typeof oEl.currentStyle.wordWrap==='string'){
          breakWord = function(oEl){
            oEl.runtimeStyle.wordWrap = 'break-word';
            return true;
          }
          return breakWord(oEl);
        }else if(document.createTreeWalker){
          var trim = function  (str) {
            str = str.replace(/^\s\s*/, '');
            var ws = /\s/,
            i = str.length;
            while (ws.test(str.charAt(--i)));
            return str.slice(0, i + 1);
          }
          breakWord = function(oEl){
            var dWalker=document.createTreeWalker(oEl,NodeFilter.SHOW_TEXT,null,false);
            var node,s,c = String.fromCharCode('8203'),
              //re = /([a-zA-Z0-9]{0,13})/;
              re = new RegExp('('+ iRe +'{0,' + iWord + '})');
            while (dWalker.nextNode()){
              node = dWalker.currentNode;
              s = trim(node.nodeValue).split(re).join(c);
              node.nodeValue = s;
            }
            return true;
          }
          return breakWord(oEl);
        }
      };
    for(var i=0,n=aEls.length; i<n; ++i){
      var sUa = navigator.userAgent,
        sTn = aEls[i].tagName.toLowerCase() ;
      if((/Opera/).test(sUa) || (/Firefox/).test(sUa) || ((/KHTML/).test(sUa) &&
      (sTn === 'td' || sTn === 'th')) || bAll){
        fnBreakWord(aEls[i]);
      }
    }
    }

    fnWordBreakAll函数提供一些定制参数,使用方法和参数含义如下:

    fnWordBreakAll({word:15,re:'[\\w]',all:true});

    参数 值 说明

    word 正整数,默认是13 在这个字数内的单词不会被插入\u8203,印象中超过13个字母的单词不多,这可以保证绝大部分单词不会被打碎

    re 正则表达式,默认[a-zA-Z0-9] 单词的正则表达式,用以确定一个单词是哪些字符组成,注意\的转义

    all 布尔值,默认false 确定是否在所有的浏览器中执行,默认在Opera和Firefox,以及当class应用在th或td的Safari上执行,这个主要用在.word-break-all没有定义时,会对IE加上样式

    className 合法class名,默认word-break-all 执行函数的元素对应属性名

    这个函数的核心部分修改自Hedger Wang 整理了一个JavaScript解决方案《Cross Browser Word Breaker》,其利用 document.createTreeWalker 和 split 方法给非IE浏览器的每个字符间加入了​ ,它用在纯中文文本基本上没有什么问题,但是如果你仔细观察他给出的例子就会发现文本中有英文或数字时,虽然解决了换行问题,但是使文本难以阅读,且增大了字符间的间距,所以我在此基础上做了上面的改进。