一个定位于不一样言语国家的公司网站必然需求供给多种言语版别的商品和出售信息来满意其世界各地运用不一样言语的客户和合作伙伴,其间包括法语、德语、意大利语、葡萄牙语、西班牙语、阿拉伯语等等。但有一个疑问却极易被网站规划者们所疏忽。这即是网站的字符集设置疑问。
通常咱们运用的是简体中文(GB2312)字符集,而对多言语网站来说,中文字符集却可能会使你辛辛苦苦的尽力功亏一篑。因素很简单:即是这个毫不起眼的小小字符集在作祟。
计算机应用领域中存在着几十种互不一样的字符集,而不一样言语客户在阅读不一样言语网页时,往往会由于相互间所运用字符集无法兼容而出现乱码状况。咱们在阅读国外一些网站时,往往也会出现为了能正常地看到网站上的信息而不得不在各种字符集之间来回切换的状况。所以对供给了多言语版别的网站来说,Unicode字符集应该是最理想的选择。它是一种双字节编码机制的字符集,不管是东方文字仍是西方文字,在Unicode中一概用两个字节来表示,因而至少能够界说65536个不一样的字符,简直能够涵盖世界上现在所有通用的言语的每一种字符。
所以在规划和开发多言语网站时,必定要注意先把非中文页面的字符集界说为“utf-8”格局,即:这一步十分重要,因素在于若等页面做好以后再更改字符集设置,可说是一件十分十分吃力不讨好的作业,有时候乃至可能需求从头再来,从头输入网站的文字内容。