本文最后更新于 6746 天前,其中的信息可能已经有所发展或是发生改变。
-
截取GB2312中文字符串
<?php //截取中文字符串 function mysubstr($str, $start, $len) { $tmpstr = ""; $strlen = $start + $len; for($i = 0; $i < $strlen; $i++) { if(ord(substr($str, $i, 1)) > 0xa0) { $tmpstr .= substr($str, $i, 2); $i++; } else $tmpstr .= substr($str, $i, 1); } return $tmpstr; } ?> -
截取utf8编码的多字节字符串
<?php //截取utf8字符串 function utf8Substr($str, $from, $len) { return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$from.'}'. '((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s', '$1',$str); } ?> -
UTF-8、GB2312都支持的汉字截取函数
<?php function cut_str($string, $sublen, $start = 0, $code = 'UTF-8') { if($code == 'UTF-8') { $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"; preg_match_all($pa, $string, $t_string); if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen))."..."; return join('', array_slice($t_string[0], $start, $sublen)); } else { $start = $start*2; $sublen = $sublen*2; $strlen = strlen($string); $tmpstr = ''; for($i=0; $i< $strlen; $i++) { if($i>=$start && $i< ($start+$sublen)) { if(ord(substr($string, $i, 1))>129) { $tmpstr.= substr($string, $i, 2); } else { $tmpstr.= substr($string, $i, 1); } } if(ord(substr($string, $i, 1))>129) $i++; } if(strlen($tmpstr)< $strlen ) $tmpstr.= "..."; return $tmpstr; } } $str = "abcd需要截取的字符串"; echo cut_str($str, 8, 0, 'gb2312'); ?>
- BugFree 的字符截取函数
<?php /** * @package BugFree * @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $ * * * Return part of a string(Enhance the function substr()) * * @author Chunsheng Wang <wwccss@263.net> * @param string $String the string to cut. * @param int $Length the length of returned string. * @param booble $Append whether append "...": false|true * @return string the cutted string. **/ function sysSubStr($String,$Length,$Append = false) { if (strlen($String) < = $Length ) { return $String; } else { $I = 0; while ($I < $Length) { $StringTMP = substr($String,$I,1); if ( ord($StringTMP) >=224 ) { $StringTMP = substr($String,$I,3); $I = $I + 3; } elseif( ord($StringTMP) >=192 ) { $StringTMP = substr($String,$I,2); $I = $I + 2; } else { $I = $I + 1; } $StringLast[] = $StringTMP; } $StringLast = implode("",$StringLast); if($Append) { $StringLast .= "..."; } return $StringLast; } } $String = "CodeBit.cn -- 简单、精彩、通用"; $Length = "18"; $Append = false; echo sysSubStr($String,$Length,$Append); ?>
很好,谢谢。。。
非常详细,谢谢!!!
我一定要来赞一下,你太神了啊,佩服哦
不错啊,很好啊!
不错哦…谢谢博主了!!!
BugFree is good!
第一个字符串截取函数如果 $start参数不为0的话会出问题,不知道你有没有遇到过,截取的初始字符不会从规定的开始,正如函数中所示,是直接加载length上了
转载了。
请问博主
[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+)这个是汉字的十六进制编码吧?
还有个问题这些通用函数同样函数解决不了,就是,我给个字符串,有汉字和英文字母,
比如:$string =”安检口abcdef”;
echo sysSubStr($string,5);
我希望输出的是五个字符,为”安检口ab”;
而实际输出的为”安检”;
还有就是有个mb_substr函数可以实现,为什么不直接用这个。可能有些php环境部支持吧。。
@phpzxh, mb_substr不是所有的服务器都有,而且这里计算数字的时候是按照一个汉字两个直接来计算的。06年写的的呢,找时间更新一下。
http://www.ccvita.com/27.html
任意网址字符串截取 http://www.ccvita.com 这一部分或http://www.ccvita.com这一部分,找不到好的实现方法,不知道您有什么好的办法!!
QQ:670608809
多谢了。我的截取一直都有问题,现在终于解决了,再次谢谢!
辛苦博主了
没有一个全能的
正在写wordpress的插件,为中文字符处理烦恼中
正在写wp的插件,为中文字符处理烦恼中
你的utf-8有用
我把你的函数和另一个UTF-8截取函数一起测试了一下,还是你的快阿