Submitted by gouki on 2010, May 4, 11:23 AM
很多做站的朋友都会有一个问题,在显示摘要的时候,如果摘要前有很多图片,那么显示出来的页面是不太正常的。比如,摘要显示100个字符,可是如果前面有很多图片,去掉图片代码后,100个字符已经几乎用完了。怎么办?
我个人是这样处理的。在PHP中,先用strip_tags去除内容中的标签,然后trim一下,再进行截取。这样的话就几乎没有什么问题了。
而这篇文章就有点意思,用作者的话来说,是无损html。来吧看看他写的内容。
最近在做一些内容搜索的工作,搜索出来的内容为html格式,列表部分需要显示每项内容的一部分。因为是html格式的内容,直接截取内容的前多少字符显 然不合适了。而如果直接去掉所有html格式然后再截取又无法达到想要的效果,再网上搜了一通之后,写下如下代码应该可以满足基本的要求了。(js写的, 因为容易调试)
JavaScript代码
- var br = {};
- br.spTags = ["img","br","hr"];
- br.contain = function(arr,it){
- for(var i=0,len=arr.length;i<len;i++){
- if(arr[i]==it){
- return true;
- }
- }
- return false;
- }
- br.subArtc = function(article,worldNum){
- var result = [];
-
- var wcount = 0;
- var startTags = [],endTags = [];
- var isInTag = false;
- for(var i=0,len=article.length;i<len;i++){
- var w = article[i];
- result.push(w);
- if(w=="<"){
- isInTag = true;
- }
- if(!isInTag){
- wcount++;
- if(wcount==worldNum){
- break;
- }
- }
- if(w==">"){
- isInTag = false;
- }
- }
-
- var j=0;
- isInTag = false;
- var isStartTag = true;
- var tagTemp = "";
- while(j<i){
- w = result[j];
- if(isInTag){
- if(w==">" || w==" " || w=="/"){
- isInTag = false;
- if(isStartTag){
- startTags.push(tagTemp);
- }else{
- endTags.push(tagTemp);
- }
- tagTemp = "";
- }
- if(isInTag){
- tagTemp+=w;
- }
- }
- if(w=="<"){
- isInTag = true;
- if(result[j+1]=="/"){
- isStartTag = false;
- j++;
- }else{
- isStartTag = true;
- }
- }
- j++;
- }
-
- var newStartTags = [];
- for(var x=0,len=startTags.length;x<len;x++){
- if(!br.contain(br.spTags,startTags[x])){
- newStartTags.push(startTags[x]);
- }
- }
-
- var unEndTagsCount = newStartTags.length - endTags.length;
- while(unEndTagsCount>0){
- result.push("<");
- result.push("/")
- result.push(newStartTags[unEndTagsCount-1]);
- result.push(">");
- unEndTagsCount--;
- }
- return result.join("");
- };
基本思路:
1.绕过标记,取得实际内容字数 ,如需要显示内容前100个字,绕过标记检索,得到第一百个字实际的索引。然后截取此索引前面的字串。
2.根据一得到的字串,得到这个字串中存在的开始标记和结束标记。注:此处的开始标记标识以"<"开通,且下一个字符不为"/"。
3.剔除2中 得到的开始标记中的不需要成对出现的标记。如br,img,hr等。
4.对比经过3处理的开始标记和2中得到的结束标记,没有配成对的在合适的位置为其配对。
此功能没有经过严格的测试,大家若有兴趣可以可以帮忙测试,有更好的想法的也可以回帖讨论。
--EOF--http://www.cnblogs.com/bravfing/archive/2010/05/02/1725924.html
我没有用PHP的试过,因为在PHP中本身对多字节的支持就不是特别的好不象js,认为中文就是一个字符。不过思路可以考虑一下,但真正要显示摘要的话,当然还是不要含 HTML代码,因为那可能会影响页面布局。
Tags: substr, html, 页面布局
Javascript | 评论:3
| 阅读:25861
Submitted by gouki on 2010, March 18, 4:01 PM
我不知道这篇文章怎么算,因为我最后还是用了JS,所以我归类到javascript分类了。
页面中的链接在新窗口中打开,一般出现在专题、网页地图、列表中,因为在一般的网页里,如果所有的链接都是开新窗口,肯定用户体验一般。而如果每个链接都加上target="_blank"的话,仿佛听说是不符合w3c规范。但我是觉得,如果一个网页有上百个链接,都加上Target="_blank",那是多少字节啊。
虽然现在不再是“惜字节如金”,但该节约的还是要节约。
于是我在页面的<head>标签里加上了<base target="_blank" />,因为记忆中,这个标签还可以控制showModalDialog里的链接不开新窗口或者影响父窗口(当然那时候是<base target="_self">)
兴冲冲的放到网上,结果同事测试下来,IE6和Firefox都正常。但IE7和IE8却都不正常。没办法,只能用js解决。本想用jquery来搞定,但为了这么小的功能就加载一个几十K的jQuery,我还不如直接在链接里加上target="_blank"呢。
最后写了如下代码:
JavaScript代码
- var aTag = document.getElementsByTagName('a');
- for(i in aTag){
- aTag[i].target='_blank';
- }
OH YEAH,搞定。
Tags: base, target
Javascript | 评论:0
| 阅读:20735
Submitted by gouki on 2010, February 23, 9:01 AM
以下内容均来自老王。说实话,simplexml的这些问题我以前遇到过,而且还是非常强烈的遇到了。
那时候是08年的事了,项目中与SOAP在交互,返回的都是XML,所以就直接采用了simplexml_load_string了。这时候就会遇到这种问题,比如我拉一个列表,但会有三种情况:1、没数据,2、1条数据,3、正常数据
1、没数据的时候,返回一个空的simplexml Object,
2、一条数据的时候,返回的也是一个simplexml Object,结果集成了这个object的元素
3、数据列表,这时候返回的却是一个Array,每一个元素是simplexml Object,等同于2。
后来我是没办法,就多写了一个函数判断,如果是object,并且不为空,直接把object强制转为array,因为,如果是空的simplexml Object,强制转的话,还是Object,转不了。。。
当时还有一个可恨的事情,我以前可能介绍过,xml在返回的时候,他的形式可能是这样的<test-name>gouki</test-name>,在返回这样的形式时,生成object时,却是test_name,在没有print_r出来时,我死活搞不定。。。后来才发现这个问题,郁闷啊
好了,说了半天,该说说老王的内容了:
这个问题遇到好几次了,今天翻看以前代码的时候看到,便记下来,先用一段代码重现一下问题:
PHP代码
- <pre>
- <?php
- $string = <<<EOF
- <data>
- <foo><bar>hello</bar></foo>
- <foo><bar>world</bar></foo>
- </data>
- EOF;
-
- $data = simplexml_load_string($string);
-
- print_r($data);
- print_r($data->foo);
- ?>
- </pre>
乍一看,结果很让人费解:
XML/HTML代码
- SimpleXMLElement Object
- (
- [foo] => Array
- (
- [0] => SimpleXMLElement Object
- (
- [bar] => hello
- )
- [1] => SimpleXMLElement Object
- (
- [bar] => world
- )
- )
- )
- SimpleXMLElement Object
- (
- [bar] => hello
- )
明明print_r显示foo是一个有两个bar元素的数组,但是最后却仅仅显示了一个bar元素!
原因其实很简单,在如上所示simplexml_load_string的结果里,foo并不是数组,而是一个迭代对象!
可以这样确认:
PHP代码
- foreach ($data->foo as $v) print_r($v);
- foreach ($data->children() as $v) print_r($v);
看来,print_r或者var_dump之类的表象并不完全可信,自己多留心吧。
原文来自:http://hi.baidu.com/thinkinginlamp/blog/item/9dbb15ce7a621632b700c86a.html
Tags: simplexml, 老王
PHP | 评论:1
| 阅读:37567
Submitted by gouki on 2010, February 22, 1:18 PM
一大早到单位,终于摒不住。还是安装了win7,成了地板人物,家里的正版win7还是留给我的笔记本吧。
现在说说安装的感觉吧。
与以前的windows 2008比起来,外观很像。安装的过程也差不多。安装速度也挺快,基本上半小时就解决了。
安装完毕后,基本上所有的硬件都能认出来,Except显卡。然后装了一个“驱动人生”软件,基本上所有的驱动也认出来了。本来是装的“驱动精灵”,但是显卡还是认不出,所以才换成了“驱动人生”。
当然安装之前,我也做了很多工作,不然我也不敢安装系统。毕竟我原来的一些配置文件还是很重要的,在那么多重要的环节中,我保留了几样最重要的工具的配置信息:
- cuteftp的站点信息,filezilla的站点信息
- firefox的全配置
- netbeans的配置
这几个是工作中必备的东西,FTP嘛,就不用说了,还有我自己的一些信息;firefox是我最常用的浏览器,也有一大堆的插件。如果每次都重装,很可能会有遗漏。所以找资料,做了一个profile启动的版本【当然,事先我还是用profile manager and synchronizer插件把profile信息备份了下来】;netbeans嘛就不用说了,这是开发工具,工作必备。
当然由于一些其他软件是可以装在D盘的,所以我就没有备份,如editplus之类的【可以设置信息留在安装目录里,当然还要留着keygen】。
总体来说,安装完后,基本上能够很快恢复正常工作。
不过,如果您要安装的话,建议还是先把网卡驱动备份一下,以防万一。【驱动精灵好象有一个版本是带了N多网卡驱动的】这样,即使没有驱动还能上网找,不然就全完了。。
Tags: win7, firefox, portable
Misc | 评论:0
| 阅读:18702
Submitted by gouki on 2009, October 1, 7:12 AM
好消息啊,一大早丈母娘打电话来说梳子的牙齿拉出来了。激动呀,再要不拉,一家门都要得忧郁症了。
自 WAP 发表
Scala & Ruby | 评论:2
| 阅读:17928