#Klooienmetcomputers

Over bits & bytes

Arnout van Kempen over rommelen in een digitale wereld.

Even een tussendoortje, volgende week verder met COBOL, geen zorgen. Maar dit moest ik even kwijt. Recent hoorde ik in de podcast Advent of Computing van Sean Haas, de historie van de byte. Zelf ben ik opgegroeid met het verhaal dat een byte bestaat uit 8 bits, en daarom ook zo heet: by eight, samengetrokken tot byte. Net zoals het woord bit een samentrekking is van binary digit.

Maar wat blijkt nu: dat klopt niet.

In de begindagen van de computer werd de kleinst adresseerbare eenheid geheugen, tevens veelal de lengte van een register, een word genoemd. Computers hadden in die tijd opvallend lange word-lengtes en die lengte stond nog allerminst vast. Nieuw model, nieuwe word-lengte. Toen IBM aan de 7030 aan het werk was, werd deze ontworpen met een word-lengte van 60 bits. Voor wetenschappelijk rekenwerk, waar de 7030 voor bedoeld was, is dat handig. Voor tekst is het bizar veel. En voor simpel rekenwerk trouwens ook. Wie met het toen wel redelijk gangbare Binary Coded Decimal wilde werken, had 4 bits nodig voor één cijfer en als je het hele alfabet en alle cijfer-tekens wil coderen, heb je genoeg aan 6 bits. Werner Buchholz, die aan de 7030 werkte, introduceerde in 1956 de term byte voor een deel van een word, groot genoeg om één data-element mee te coderen. En omdat het van het gebruik afhangt hoeveel bit je nodig hebt, werd een byte gedefinieerd als een deel van een word van 1, 2, 3, 4, 5 of 6 bits. Dat is handig als je een 60 bits word hebt; immers je byte past dan altijd precies een geheel aantal malen in een word. 60 is immers deelbaar door 1, 2, 3, 4, 5 en 6.

Een bijkomende aardigheid is dat in die tijd de ponskaart door IBM nog steeds werd gebruikt. En laat die nu al sinds 1928 een standaard formaat hebben van 80 kolommen bij 12 rijen. Inderdaad, daar komt de 80-kolomsmonitor vandaan, maar het gaat even om die 12. Dat is precies twee 6-bits bytes, daarmee kan je dus netjes twee letters/cijfers coderen.

Maar waar komt dan die 8-bits byte vandaan? Toen IBM naast letters ook nog onderscheid wilde maken tussen hoofdletters en kleine letters, waren 6 bits niet meer genoeg. In Amerika ontwikkelde men de ASCII-set, een 7 bits tekenset, waarmee Amerikanen ongeveer tot in de eeuwigheid vooruit hadden moeten kunnen. Probleempje van 7 bits is dat computers dat geen rond getal vinden en dat er nauwelijks mooie word-lengtes van te maken zijn. Ander probleempje is dat buiten Amerika veel meer lettertekens nodig zijn. Alleen al in Europa hebben we behoefte aan allerlei streepjes, puntjes en krulletjes rond letters. Dus ontwikkelde IBM de codering EBCDIC, een 8 bits-code, voor haar mainframes, en kwam Unicode met een systeem waarin honderdduizenden tekens worden gecodeerd, zodat iedere taal er een plaats in kan vinden.

ASCII is voor microcomputers uiteindelijk belangrijker geworden dan EBCDIC, maar dan wel in een 8 bits-variant, waarbij individuele fabrikanten voor de 127 ASCII-tekens de standaard volgden en voor de rest hun eigen creativiteit los lieten. Vanaf die tijd werd wel langzaamaan vanzelfsprekend dat een byte = 8 bits en een word is twee of meer bytes.

En de naam, byte? Daar is weinig zekerheid over te vinden, maar het lijkt er op dat oorspronkelijk sprake was van een bite. En dat gaf verwarring met de bit, dus werd het byte. 

Wie mee wil doen met #klooienmetcomputers kan dat doen via GitHub. Maak een account op github.com en zoek naar Abmvk/kmc. Het account Abmvk volgen kan ook. Lezers zijn vrij te gebruiken wat ze willen en om zelf zaken toe te voegen of aan te passen, vragen te stellen of commentaar te leveren.

Arnout van Kempen di CCO CISA is directeur compliance & risk bij aaff, de fusieorganisatie van Alfa en ABAB. Hij schrijft op persoonlijke titel.

Gerelateerd

7 reacties

Ron Heinen

Als aanvulling op de eerdere reacties op deze #Klooienmetcomputers :

De donderdag voor Kerst heeft de Koning zich op de Universiteit Twente voor laten lichten over het onderzoek naar en de productie van optische chips, bijvoorbeeld voor de nieuwe generatie Quantum Computers. Op de link

https://tinyurl.com/mv4n4wzr

kun je hiervan een foto vinden.

Op de voorgrond zie je een Quantum Computer en op de achtergrond zie je Pepijn Pinkse.

De inaugurele rede van Pepijn Pinkse kun je vinden op:

https://photos.app.goo.gl/F9qX6ekGRNwnNZGB7

Het symposium Quantum for Dummies dat voorafging aan de inaugurele rede kun je vinden op:

https://photos.app.goo.gl/JueuPvNMdZckVra17

Met toekomstige Quantum Computers zal bijvoorbeeld de huidige Publiek/Private beveiliging gekraakt kunnen worden.

Ron Heinen

Op https://www.ndax.eu/TnMjbSkq72-hHFbiE6be.7z kun je een voorbeeld informatie-theoretisch bewijs vinden
conform de informatie-theorie, zie mijn eerdere reacties op deze #Klooienmetcomputers

Dit is het veiligheidsbewijs van het Ndax Quantum Systeem op de Ndix Internet Exchange van de Universiteit Twente.

Op de link

https://photos.app.goo.gl/XRcRX84H48EvhX9i9

zijn voorbeelden te vinden waar het Ndax Quantum Systeem systeem is ingezet voor de onafhankelijke beoordeling van PhD verdedigingen door onafhankelijke experts wereldwijd. Onder de foto's kun je referenties
vinden.

Bij de onafhankelijke beoordeling van onderzoek is geheimhouding en privacy van de experts verplicht.

Waarom informatie-theoretische beveiliging in het Ndax Quantum Systeem is toegepast is bijvoorbeeld te zien op

https://photos.app.goo.gl/KkxuXir5jkWSnoNZ9

Hier is onderzoek te vinden naar aanvallen op het Netwerk van de Universiteit Twente.

China is topscoorder succesvolle aanvallen.

De komst van Quantum Computers waarmee alle publieke sleutel
beveiliging gekraakt kan worden is ook niet meer uit te sluiten.

Mede daarom is het sinds 2020 verplicht voor bepaalde informatie
beveiliging te gebruiken welke informatie-theoretisch bewijsbaar
veilig is. Het Ndax Quantum Systeem voldoet hieraan.

Voor een additionele toelichting zie bijvoorbeeld

https://www.youtube.com/watch?v=NbJr7xzuo8U

Ron Heinen

@Arnout van Kempen

Jou URL verwijst naar de algemene website meer zeer veel podcasts, zodat de goede podcast moeilijk te vinden is.

Mijn URL verwijst direct naar de goede podcast: Episode 117

Arnout van Kempen

Nee hoor, de relevante URL staat er gewoon in: https://adventofcomputing.com/resources.html

Ron Heinen

De URL van de podcast waarnaar verwezen is ontbreekt in deze #Klooienmetcomputers

De podcast is te vinden op:

https://open.spotify.com/episode/5eACL2L3THkdPRrIqfN11d

Ron Heinen

De informatie welke door Robbert Dijkgraaf is aangehaald ove Shannon in de vorige reactie is te vinden op:

https://www.ndax.eu/TheInformation.pdf

Ron Heinen

Aansluitend op deze uitleg van Bits&Bytes kun je op

https://npo.nl/start/serie/dwdd-university-presenteert/seizoen-7/informatie-door-robbert-dijkgraaf/afspelen

een mooie inleiding over informatie vinden. Het bit is de kleinste hoeveelheid informatie, de bouwsteen van informatie. Zoals je in de inleiding van Robbert Dijkgraaf kunt zien is dit de uitvinding van Shannon, wat bekend staat als de Informatie-Theorie, de wiskunde van informatie.

https://www.fisme.science.uu.nl/nwd/nwd2001/produkten/melissen.pdf

is een nederlandstalige inleiding op de informatie-theorie.

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.