T086学习网 | 站长学院 | 技术文档 | 成语 | 歇后语 | 帝国时代 | 代码收藏 | IP地址查询 | 生活百科 | 生日密码 | CSS压缩 | 用户评论 | 欣欣百宝箱

PHP中GBK和UTF8编码处理

2007-04-20 17:44:19
一、编码范围 1. GBK (GB2312/GB18030)x00-xff GBK双字节编码范围x20-x7f ASCIIxa1-xff 中文x80-xff 中文 2. UTF-8 (Unicode)u4e00-u9fa5 (中文)x3130-x318F (韩文xAC00-xD7A3 (韩文)u0800-u4e00 (日文)ps: 韩文是大于[u9fa5]的字符 正则例子:preg_replace( /([x80-xff])/ , ,$str);preg_replace( /([u4e00-u9fa5])/ , ,$str); 二、代码例子 //判断内容里有没有中文-GBK (PHP)function check_is_chinese($s){ return preg_match('/[x80-xff]./', $s);}//获取字符串长度-GBK (PHP)function gb_strlen($str){ $count = 0; for($i=0; $i<strlen($str); $i++){ $s = substr($str, $i... 查看详细内容 >>
PHP中GBK和UTF8编码处理的相关文章推荐
utf8  GBK  编码 

中文编码杂谈

编码问题的例子在windows自带的notepad(记事本)程序中输入“联通”两个字,保存后再次打开,会发现“联通”不见了,代之以“��ͨ”的乱码。这是windows平台上典型的中文编码问题。即文件保存的时...

PHP字符编码绕过漏洞--addslashes、mysql_real_escape漏洞

在上次活动开发过程中,有个程序写了下面这样的语句:$sName = $_GET['name']; $sName = addslashes($sName); $sql = "SELECT COUNT(lGid) AS total FROM tbRank WHERE `sName` LIKE '%$sName%';"; va...

PHP字符GBK编码漏洞总结

该漏洞最早2006年被国外用来讨论数据库字符集设为GBK时,0xbf27本身不是一个有效的GBK字符,但经过 addslashes() 转换后变为0xbf5c27,前面的0xbf5c是个有效的GBK字符,所以0xbf5c27会被当作一个字符0xbf5c和一个单引...

GBK字符集下addslashes函数的注入漏洞及BUG的解决办法

大家都知道,addslashes是过滤垃圾信息的函数,如果你的PHP环境打开了魔法函数,那么addslashes这个函数将自动运行对用户提交的信 息进行过滤。但是addslashes函数在进行转义的时候,只对二进制字符串操作二不考虑字...

中文字符集与字符编码(gb2312,big5)的基础知识

字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB...

linux下使用nc进行大文件跨网传输

很多时候,我们需要将一些大的文件进行跨网传输,一个文件动不动几十G,当你的带宽资源紧张的时候,传输这样几个文件会花10小时,甚至几天。 nc传输文件,通过以下方法,将加快文件传输,希望对大家有所帮助。 环境:...

PHP中GBK和UTF8编码处理

一、编码范围1. GBK (GB2312/GB18030)x00-xff GBK双字节编码范围x20-x7f ASCIIxa1-xff 中文x80-xff 中文2. UTF-8 (Unicode)u4e00-u9fa5 (中文)x3130-x318F (韩文)xAC00-xD7A3 (韩文)u0800-u4e00 (日文)ps: 韩文是大于...

linux下GBK->UTF-8文件编码批量转换脚本

find default -type d -exec mkdir -p utf/{} ;find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} ;这两行命令将default目录下的文件由GBK编码转换为UTF-8编码,目录结构不变,转码后的文件保存在utf/...

GB2312简体中文编码表

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +FA1A0   、 。 · ˉ ˇ ¨ 〃 々 — ~ ‖ … ‘ ’A1B0 “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ...

JAVA字符集编码

1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。 在下面的描述中,将以 中文 两个字为例,经查表可以知道其GB2312编码是 d6d0 cec4 ,Unicode编码为 4e2d 6587 ,UTF编码就是 e...

38条PHP编码优化加速技巧

1. 尽量采用大量的PHP内置函数。 2. echo 比 print 快。 3. 不要把方法细分得过多,仔细想想你真正打算重用的是哪些代码? 4. 在执行for循环之前确定最大循环数,不要每循环一次都计算最大值。 5. 注销那些不用的变量...

PHP版UTF-8文件BOM自动检测移除程序

BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。但PHP在读取文件时会把这些字符读出,从而形成了文件开头含有一些无法识别的字符的问题。 比如用UTF-8格式保存的生成图片的PHP文件...

Flash 视频(FLV)编码,转换,录制,播放方案一网打尽

Collected links to Flash Video Encoding Tools & Related这是我收集的一份列表,自认为比较完整,希望对大家有所帮助.如果你知道更多,欢迎补充啦! 客户端编码工具(Client-Side-FLV-Encoding)场景:拿到一个 MPG 或...

ajax代理程序自动判断字符编码

由于ajax在跨域的访问上有问题,目前最好的方法是做代理.写了个代理程序和心得. 为了做ajax的代理,研究了下服务器端的xmlhttp并和客户端的ajax中的xmlhttp做了个比较,后台代码是asp的. 服务器端的xmlhttp也就是asp小偷...

关于页面编码的doctype:使用正确的doctype声明

虽然大多数Web文档的顶部都有doctype声明,但很多人都没有注意它。它是在你新建一个文档时,由Web创作软件草率处理的众多细节之一。虽然doctype被许多人忽视,但在遵循标准的任何Web文档中,它都是一项必需的元素。d...

谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词

这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题: 问题一: 使用Windows记事本的“另存为”,可以在GB...

程序人生:编码生活没有灯红酒绿

  猛地睁开眼,伸手摸到手机,“靠,还有十几分钟快9点了”。杨力从床上跳起来,趿着拖鞋跑到卫生间。卫生间很小,虽然他租的这个房子年头不长,可是卫生间墙壁很像用了很久的键盘,斑斑驳驳。因为新公司在科技园,...

使用Web标准建站第3天:定义语言编码

  第三步是定义你的语言编码,类似这样:<meta http-equiv= Content-Type content= text/html; charset=gb2312 />   为了被浏览器正确解释和通过W3C代码校验,所有的XHTML文档都必须声明它们所使用的编码语...

C# 编码规范和编程好习惯

撰文:DotNetSpider.com(http://www.dotnetspider.com) 翻译:杨贺宏 谁都会写代码!几个月的编程经验可以让你写出“可运行应用程序”。让它可运行容易,但是以最有效率的方式编码就需要下更多的功夫!要知道,大多...
更多
留言建议ASP探针PHP探针站长Enjoy的Blog
© 2017 T086学习网 - T086.com(原itlearner.com)
RunTime:21.90ms QueryTime:3