Charset ascii - studopediya
Anyaga önálló tanulmányt a témáról Előadások 2
Kódolási táblázat ASCII (ASCII - American Standard Code for Information Interchange - American Standard Code for Information Interchange).
Összesen ASCII kódolási táblázat (1. ábra) kódolhat 256 különböző karakter. Ez a táblázat két részre oszlik: fő (a kódok OOH hogy 7FH) és a kiegészítő (a 80H és FFh, ahol a H betű jelöli a kódot tartozó hexadecimális rendszer).
A kódoló egy karakter egy táblából hozzárendelt 8 bit (1 bájt). A feldolgozás szöveges információk egy bájt tartalmazhat egy karakter kódját - betűk, számok, írásjelek, akciók, stb védjegy Minden karakter saját kódja formájában az egész. Ebben az esetben az összes kód gyűjtik asztalt, az úgynevezett kódolás. Segítségükkel tette a karaktert kódkonverzió annak látható ábrázolás a képernyőn. Ennek eredményeként, a szöveget a számítógép memóriájában képviseli, mint bájtok sorozata a karakter kódok.
Például, a szó hello! kódolható a következőképpen (1. táblázat).
Az 1. ábra a szimbólumok szerepelnek a standard (angol) és kiterjesztett (orosz) ASCII kódolás.
Az első felében ASCII tábla szabványosított. Ez tartalmaz vezérlő kódokat (az 00h 20h 77h és). Ezek a kódok eltávolítjuk a táblázatban, mivel azok nem vonatkoznak a szöveges elemekhez. Itt kerülnek írásjeleket és a matematikai jelek: 2LH -. 26h - , 28h - (, 2Bh - + kis és nagy betűk :. 41h - A, 61H - a.
A második felében a táblázat tartalmazza a nemzeti betűtípus, rajz karakterek, amelyek építhető az asztalra, speciális matematikai szimbólumok. Az alsó része a kódtáblát lehet cserélni a megfelelő illesztőprogramok - ellenőrzési támogatási programokat. Ez a technika lehetővé teszi a használatát több betűtípust és betűtípusok.
Minden karakter kódja kijelző megjeleníti a szimbólum kép - nemcsak a digitális kód és a megfelelő képet, mint az egyes karakternek megvan a saját formáját. Leírás képez minden karakter egy memóriában tárolt a kijelző - karakter generátort. A következő a kijelzőn a szimbólum IBM PC, például útján pontok kialakítására jellegű mátrixban. Minden pixel egy ilyen mátrix egy eleme a kép, és lehet világos vagy sötét. Sötét dot van kódolva 0, fényes (világos) - 1. Ha a mátrixban jelentik területén sötét pixelek megjelöli azt a pontot, és a fény - egy csillag, akkor ábrázolják a karakter alakját grafikusan.
Az emberek különböző országok karakter rögzíti a szavakat a saját anyanyelvük van. Manapság a legtöbb alkalmazás, beleértve az e-mail rendszerek és böngészők, tisztán 8 bites, azaz meg tudják jeleníteni, és helyesen érzékelni csak 8 bites karaktereket, az ISO-8859-1 szabványnak.
Jelenleg több mint 256 karakter a világon (ha figyelembe vesszük, cirill, arab, kínai, japán, koreai és thai), és egyre több és több új karaktert. És létrehozza az alábbi hiányosságok sok felhasználó számára:
Nem tudja használni karakterek különböző kódolások ugyanabban a dokumentumban. Mivel minden szöveges dokumentumot használ saját sorozata kódolás van, akkor nagy nehézségek automatikus szöveges elismerést.
Vannak új karaktert (pl euró), ami az ISO fejleszt egy új ISO-8859-15 szabvány, amely nagyon hasonlít az ISO-8859-1 szabványnak. A különbség a következő: a ISO-8859-1 kódolás régi szabvány szimbólumokat lásd a táblázatot a régi valuták már eltávolították, ami nincs használatban, annak érdekében, hogy legyen hely az újonnan kialakuló karaktereket (például euró). Ennek eredményeként a felhasználók fekszenek a lemezeken ugyanazokat a dokumentumokat, de különböző kódolások. A megoldás ezekre a problémákra az elfogadása egy nemzetközi halmaza kódolás, ami az úgynevezett univerzális kódolási vagy Unicode.