注册
登录
搜索
帮助
中国Linux公社论坛
»
应用编程技术与项目孵化
» linux下一个中文占3个字节么?
‹‹ 上一主题
|
下一主题 ››
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
linux下一个中文占3个字节么?
yk103
新手上路
发短消息
加为好友
当前离线
1
#
大
中
小
发表于 2006-12-16 10:51
只看该作者
linux下一个中文占3个字节么?
如题,windows下一个汉字,用内码表示,是两个字节。但是linux下好像不同阿?
#include<stdio.h>
main(){
unsigned char c;
while((c=getchar())!=EOF){
printf("%d ",c);
putchar(c);
printf("\n");
}
}
我
230
136
145
10 //e
大虾们指点下
先谢过了
个人空间: http://yk103.blogcn.com.cn 有空来看看~
UID
225206
帖子
18
精华
0
积分
41
阅读权限
10
在线时间
5 小时
注册时间
2006-9-8
最后登录
2007-11-25
查看个人网站
查看详细资料
TOP
opendarwin
注册会员
发短消息
加为好友
当前离线
2
#
大
中
小
发表于 2006-12-16 11:02
只看该作者
跟编码有关
*OPENDARWIN*
家已在后,世界在前;穿越夜晚边缘的暗影,直到所有星星沉寂
UID
62210
帖子
88
精华
0
积分
202
阅读权限
20
来自
Chine
在线时间
3 小时
注册时间
2003-9-17
最后登录
2008-11-6
查看详细资料
TOP
loveccy
中级会员
发短消息
加为好友
当前离线
3
#
大
中
小
发表于 2006-12-16 12:56
只看该作者
所有的东西,都是字节流,一个接一个的字节。
`我’这个字,utf-8编码是0xe6、0x88、0x91;gb编码就是0xce、0xd2。
看到的只有那两或三个字节,达到无`我’境界,才算入道。
又开始胡说八道了,其实我也是才想明白这个。
UID
38841
帖子
333
精华
0
积分
773
阅读权限
30
来自
China
在线时间
27 小时
注册时间
2003-5-21
最后登录
2008-10-18
查看详细资料
TOP
yk103
新手上路
发短消息
加为好友
当前离线
4
#
大
中
小
发表于 2006-12-16 15:39
只看该作者
听君一席话,胜读十年书阿!!!
谢了
个人空间: http://yk103.blogcn.com.cn 有空来看看~
UID
225206
帖子
18
精华
0
积分
41
阅读权限
10
在线时间
5 小时
注册时间
2006-9-8
最后登录
2007-11-25
查看个人网站
查看详细资料
TOP
loveccy
中级会员
发短消息
加为好友
当前离线
5
#
大
中
小
发表于 2006-12-16 17:32
只看该作者
别这么说。读十年书很了不起了。大家共同提高。我也是前些日子才刚刚想明白这个东西。
(交通灯:
)
UID
38841
帖子
333
精华
0
积分
773
阅读权限
30
来自
China
在线时间
27 小时
注册时间
2003-5-21
最后登录
2008-10-18
查看详细资料
TOP
fish_007
注册会员
发短消息
加为好友
当前离线
6
#
大
中
小
发表于 2006-12-17 15:38
只看该作者
不明白。学习~~~
http://www.c-estbon.com.cn
UID
97838
帖子
60
精华
0
积分
150
阅读权限
20
来自
China
在线时间
0 小时
注册时间
2004-2-23
最后登录
2005-12-27
查看详细资料
TOP
chwoozy
高级会员
发短消息
加为好友
当前离线
7
#
大
中
小
发表于 2006-12-28 20:25
只看该作者
确实,UTF-8是三字节编码
UID
190420
帖子
646
精华
0
积分
1461
阅读权限
50
来自
重庆万盛
在线时间
116 小时
注册时间
2005-5-3
最后登录
2009-1-5
查看详细资料
TOP
fivesheep
新手上路
发短消息
加为好友
当前离线
8
#
大
中
小
发表于 2007-1-3 10:54
只看该作者
[quote:dddb2e2980="chwoozy"]确实,UTF-8是三字节编码[/quote]
utf-8 是变长的, cjk这些复杂的字符才用3字节
UID
234755
帖子
2
精华
0
积分
5
阅读权限
10
在线时间
0 小时
注册时间
2006-12-31
最后登录
2007-3-23
查看详细资料
TOP
volans
新手上路
发短消息
加为好友
当前离线
9
#
大
中
小
发表于 2007-1-8 14:57
只看该作者
UTF-8是在标准unicode的基础上改进的。标准unicode编码包含各种语言文字,并将起统一编码,每一个字都占用4Byte的空间,不管是中文还是英文,亦或什么日文韩文……
UTF-8是一种变长的编码,一般一个汉字会使用3Byte的空间,而英文字母(ASIC表前12
就只使用1Byte的空间,这样就大大节省了空间。有兴趣的可以研究以下UTF-8编码标准……
父母赐予名字 自己打造品牌
UID
235233
帖子
10
精华
0
积分
25
阅读权限
10
在线时间
0 小时
注册时间
2007-1-8
最后登录
2007-2-26
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››
版块跳转
社区公告专栏:最新通知和公告
公告区
基础技术支持专栏:
系统安装
硬件配置
Magic Linux专版:
Magic Linux技术支持区
Magic Linux开发培训版
一般应用技巧专栏:
中文化与桌面美化
桌面使用小技巧
命令行使用小技巧与SHELL编程
应用解决方案专栏:
网络工具
办公软件
多媒体应用
游戏乐园
服务器与网络安全
Linux资源共享区
高级技术学习专栏:
Debian/LFS/Gentoo专题版
Linux高质量字体研究
easyright计算机研究所
Linux认证考试专题版
社区开源项目专栏
应用编程技术与项目孵化
网站开发技术与项目孵化
参与国际开源项目
翻译汉化
中文GNOME用户交流区
Skyeye项目专栏
lumit项目专栏
eva项目专栏
fanx及slax中文专栏
连连看for Linux项目专栏
OurLinux杂志专区
BitStorm项目专栏
RT-Thread实时操作系统
EGui开源项目
AVS项目专栏
VirgoFTP项目专栏
Linux内核研读区:公社内核阅读小组
内核源代码阅读交流
内核安装和升级
嵌入式开发
社区文化活动专栏:我们是一家人!
校园行动联盟
Linux与公社文化杂谈
请进公社总部:
公社接待中心
控制面板首页
编辑个人资料
积分交易
积分记录
公众用户组
访问推广
基本概况
版块排行
主题排行
发帖排行
积分排行
交易排行
在线时间
管理团队
管理统计