Diferencies ente revisiones de «Unicode»
Contenido eliminado Contenido añadido
m correiciones |
m Bot: Orotografía habitual na wiki |
||
Llinia 20:
Esti estándar ye calteníu pol [[Unicode Technical Committee]] (UTC), integráu nel [[Consorciu Unicode]], del que formen parte con distintu grau d'implicación empreses como: [[Microsoft]], [[Apple Inc.|Apple]], [[Adobe_Systems_Incorporated|Adobe]], [[IBM]], [[Oracle]], [[SAP AG|SAP]], [[Google]] o [[Yahoo]], instituciones como la [[Universidá de Berkeley]], y profesionales y académicos a títulu individual.<ref name="UNICODE-MEMBERS">{{cita web |url= http://unicode.org/consortium/memblogo.html |títulu= The Unicode Consortium Members |editorial= Unicode, Inc. |fechaacceso=15 de mayu de 2012}}</ref>
El Unicode Consortium caltién estrecha relación con ISO/IEC, cola que caltién dende 1991 l'alcuerdu de sincronizar los sos estándares que contienen los mesmos calteres y puntos de códigu.<ref name="UNICODE-ISO">{{cita
L'establecimientu de Unicode foi un ambiciosu proyectu pa reemplazar los esquemes de [[codificación de calteres]] esistentes, munchos de los cualos tán bien llindaos en tamañu y son incompatibles con redolaes plurilingües. Unicode volvióse'l más estensu y completu esquema de codificación de calteres, siendo'l dominante na [[Internacionalización (computación)|internacionalización]] y adaptación local del [[software|software informáticu]]. L'estándar foi implementáu nun númberu considerable de tecnoloxíes recién, qu'inclúin [[XML]], [[llinguaxe de programación Java|Java]] y [[sistemes operativos]] modernos.
Llinia 37:
=== Relación con otros estándares ===
Como yá s'indicó, Unicode ta sincronizáu col estándar ISO/IEC conocíu como [[ISO 10646|UCS]] o xuegu de calteres universal. Dende un puntu de vista técnicu, inclúi o ye compatible con codificaciones anteriores como ASCII7 o [[ISO 8859-1]], los estándares nacionales ANSI Z39.64, KS X 1001, JIS X 0208, JIS X 0212, JIS X 0213, GB 2312, GB 18030, [[HKSCS]], y [[CNS 11643]], codificaciones particulares de fabricantes de software como Apple, Adobe, Microsoft, IBM, etc. Amás, Unicode acuta espaciu pa fabricantes de software que pueden crear estensiones pal so propiu usu.<ref name="UNICODE">{{cita
== Repertoriu de calteres ==
Llinia 48:
[[Archivu:Angstrom unicode sample.svg|right|thumb|350px|Distintes versiones del calter [[angstrom]], como calter (versión preferida), como calter con signu diacríticu y como símbolu con forma de lletra.]]
Los bloques del espaciu de códigos contienen puntos cola siguiente información:<ref name="UNICODE-CODIGOS">{{cita
* Calteres gráficos: lletres, signos diacríticos, cifres, calteres de puntuación, símbolos y espacios.
Llinia 68:
=== Repertoriu unificáu chinu, coreanu y xaponés ===
Nel estándar Unicode, los ideogrames d'Asia oriental (popularmente llamaos «calteres chinos») denominar «ideogrames han». Estos ideogrames desenvolver en China y fueron afechos por cultures próximes pal so propiu usu.<ref name="UNICODE-HAN1">{{cita web |título=On the Encoding of Latin, Greek, Cyrillic, and Han |url=http://www.unicode.org/notes/tn26/}}</ref><ref name="UNICODE-HAN2">{{cita
[[Xapón]], [[Coria]] y [[Vietnam]] desenvolvieron los sos propios sistemes alfabéticos o silábicos pa usar en combinación colos símbolos chinos: [[hiragana]] y [[katakana]] (en Xapón), [[hangul]] (en Corea) y [[yi]] (en Vietnam). La evolución natural de los sistemes d'escritura y los distintos momentos d'entrada de los calteres nes distintes cultures marcaron diferencies nos ideogrames utilizaos. Unicode considera les distintes versiones de los ideogrames como variantes d'un mesmu calter astractu, esto ye, como resultáu de l'aplicación d'un [[tipu de lletra]] distinta en cada casu y considera les variantes nacionales como pertenecientes a un mesmu sistema d'escritura. La versión orixinal del estándar desenvolver a partir de los estándares industriales esistentes nos países afectaos.
Llinia 135:
Los puntos de códigu de Unicode identificar por un númberu enteru. Según la so arquiteutura, un ordenador va utilizar unidaes de 8, 16 o 32 bits pa representar dichos enteros. Les ''formes de codificación'' de Unicode reglamentan la forma en que los puntos de códigu van tresformar n'unidaes tratables pol computador.
Unicode define trés formes de codificación sol nome '''UTF''' (Unicode transformation format: formatu de tresformamientu Unicode):<ref name="UNICODE-UTF">{{cita
|capítulu=2.5 Encoding Forms|urlcapítulo=http://www.unicode.org/versions/Unicode5.0.0/ch02.pdf |fecha= ochobre de 2006 |fecha = ochobre de 2006 |editorial= Addisson-Wesley |idioma= inglés |isbn= 0-321-48091-0}}</ref>
* [[UTF-8]]: codificación empobinada a byte con símbolos de llargor variable.
Llinia 186:
La unidá de codificación en UTF-8 ye'l byte polo que nun precisa una indicación d'orde de byte. L'estándar nin rique nin encamienta l'usu de BOM, pero almitir como marca de que'l testu ye Unicode o como resultáu de la conversión d'otros esquemes.
==
El proyectu Unicode empecipiar a finales de [[1987]], tres conversaciones ente Joe Becker, Llee Collins y Mark Davis (inxenieros de les empreses [[Apple Inc.|Apple]] y [[Xerox]]).<ref name="UNICODE-HISTORY">{{cita web | título = Chronology of Unicode Version 1.0 | url= http://www.unicode.org/history/versionone.html}}</ref> Como resultáu de la so collaboración, n'agostu de [[1988]] publicóse'l primer borrador de Unicode sol nome de Unicode88.<ref name="UNICODE-DRAFT">
Llinia 253:
| 38
| 49 259
| Ideogrames [[idioma cheroqui|cheroqui]]. Escritures [[alfabetu etíope|etíope]], [[idioma camboyanu|jemer]], [[idioma mongol|mongol]], [[idioma birmanu|Myanmar]], [[ogham]], [[alfabetu rúnicu]], [[idioma cingalés|cingalés]], [[alfabetu siríaco|siríaco]], [[thaana]], [[silabarios indíxenes canadienses|silabariu unificáu de los indíxenas canadienses]], y [[yi]] amás d'el patrones [[Braille (llectura)|braille]].<ref name="UNICODE-CAMBEOS3">{{cita
|-
| 3.1
Llinia 287:
| 59
| 97 720
| Agregaos [[idioma buginés|buginés]], [[alfabetu glagolítico|glagolítico]], [[kharoshthi]], [[new tai lue]], [[persa antiguu]], [[idioma sylheti|syloti nagri]], y [[nifinagh]]. Dixébrase'l [[alfabetu coptu|coptu]] del alfabetu griegu. Símbolos griegos antiguos pa música y numberación.<ref name="UNICODE-CAMBEOS5">{{cita
|-
| 5.0
|