Dans le développement web, nous rencontrons des données binaires principalement lorsque lâon travaille avec des fichiers (création, envoi, téléchargement). Un autre cas dâutilisation est le traitement dâimage.
Tout ceci est possible en JavaScript, et les opérations binaires sont très performantes.
Cependant, il y a de la confusion, car il y a beaucoup de classes disponibles. Pour en nommer quelques unes:
ArrayBuffer,Uint8Array,DataView,Blob,File, etc.
En javascript, les données binaires sont implémentées de façon non standard, comparé à dâautres langages. Mais quand nous mettons de lâordre dans tout ça, tout devient beaucoup plus simple.
Lâobjet binaire de base est un ArrayBuffer â une référence à une zone contigüe de taille fixe de la mémoire.
Nous le créons comme ceci:
let buffer = new ArrayBuffer(16); // crée un Buffer de taille 16
alert(buffer.byteLength); // 16
Cela alloue une zone contigue de 16 octets dans la mémoire et la pré-remplie avec des zéros.
ArrayBuffer nâest pas un tableau de âquelque choseâ.Commençons par éliminer une possible source de confusion. ArrayBuffer nâa rien en commun avec Array:
- Il possède une taille fixe, nous ne pouvons ni lâaggrandir, ni le réduire.
- Il prend une taille spécifique en mémoire.
- Pour accéder à des octets individuels, un autre objet de âvueâ est nécessaire, on nâutilise pas
buffer[index].
ArrayBuffer est une zone de la mémoire. Qui yâa tâil à lâintérieur ? Juste une séquence dâoctets.
Pour manipuler un ArrayBuffer, nous avons besoin dâutiliser un objet de âvueâ.
Un objet de âvueâ ne stocke rien tout seul. Ce sont les lunettes qui donnent une interprétation des octets stockés dans lâArrayBuffer.
Par exemple:
Uint8Arrayâ Traite chaque octet dans lâArrayBuffercomme un nombre unique, avec des valeurs possibles entre 0 jusquâà 255 (Un octet est sur 8 bits, donc ça ne peut contenir que ça). On appelle ces valeurs des âentiers non signés sur 8 bitsâ.Uint16Arrayâ Traite par paquet de 2 octets en tant quâentier, avec des valeurs possibles entre 0 jusquâà 65535. On appelle ces valeurs des âentiers non signés sur 16 bitsâ.Uint32Arrayâ Traite par paquet de 4 octets en tant quâentier, avec des valeurs possibles entre 0 jusquâà 4294967295. On appelle ces valeurs des âentiers non signés sur 32bitsâ.Float64Arrayâ Traite par paquet de 8 octets en tant que nombre flottant avec des valeurs possibles entre5.0x10-324et1.8x10308.
Donc, les données binaires dans un ArrayBuffer de 16 octets peuvent être interprétées comme 16 âpetits nombresâ , ou 8 grands nombres (2 octets chacun), ou 4 encore plus grands (4 octets chacun), ou 2 valeurs flottantes avec une haute précision (8 octets chacun).
ArrayBuffer est lâobjet central, le centre de tout, les données binaires brutes.
Mais si nous voulons écrire à lâintérieur, ou itérer dessus, pour nâimporte quelle opération â nous devons utiliser une âvueâ, e.g:
let buffer = new ArrayBuffer(16); // crée un buffer de taille 16
let view = new Uint32Array(buffer); // Traite le buffer en une séquence d'entiers de 32 bits.
alert(Uint32Array.BYTES_PER_ELEMENT); // 4 octets par entier.
alert(view.length); // 4, il stocke cette quantité d'entiers.
alert(view.byteLength); // 16, la taille en octets.
// Ecrivons une valeur
view[0] = 123456;
// Itérons sur les valeurs
for(let num of view) {
alert(num); // 123456, puis 0, 0, 0 (4 valeurs au total)
}
TypedArray â tableau typé
Le terme commun pour toutes ces vues (Uint8Array, Uint32Array, etc) est TypedArray. Elles partagent le même ensemble de méthodes et de propriétés.
Il faut noter quâil nây a pas de construteur appelé TypedArray, Il sâagit dâun terme pour représenter une des vues par dessus un ArrayBuffer: Int8Array, Uint8Array etc. La liste entière va bientôt suivre.
Lorsque vous voyez quelque chose comme new TypedArray, Il sâagit de nâimporte quoi parmi new Int8Array, new Uint8Array, etc.
Les tableaux typés ressemblent à des tableaux classiques : ils ont des indexs et sont itérables.
Un constructeur TypedArray (soit Int8Array ou Float64Array, peut importe) se comporte différement en fonction du type des arguments.
Il y a 5 variantes dâarguments:
new TypedArray(buffer, [byteOffset], [length]);
new TypedArray(object);
new TypedArray(typedArray);
new TypedArray(length);
new TypedArray();
-
Si un
ArrayBufferest fourni, la vue est créée dessus. Nous avons déjà utilisé cette syntaxe.Nous pouvons éventuellement fournir un décalage (
byteOffset) pour commencer à partir de là (0 par défaut) et la longueur (length) (jusquâà la fin du buffer par défaut), alors la vue ne va couvrir quâune partie dubuffer. -
Si câest un
Array, ou quelque chose ressemblant à un tableau qui est fourni, il crée un tableau typé de la même longueur et copie le contenu.Nous pouvons lâutiliser pour pré-remplir le tableau avec les données:
let arr = new Uint8Array([0, 1, 2, 3]); alert( arr.length ); // 4, a créé une liste binaire de la même taille alert( arr[1] ); // 1, remplit avec 4 octets (entiers non signés sur 8 bits) avec des valeurs données -
Si un autre tableau typé est fourni, il fait la même chose: il crée un tableau typé de la même taille et copie le contenu. Les valeurs sont converties vers le nouveau type dans le processus si besoin.
let arr16 = new Uint16Array([1, 1000]); let arr8 = new Uint8Array(arr16); alert( arr8[0] ); // 1 alert( arr8[1] ); // 232, 1000 ne rentre pas dans 8 bits (explications plus loin) -
Si un argument
lengthest fourni â Il crée un tableau typé qui contient autant dâéléments. Sa taille en octets va êtrelengthmultiplié par la taille en octets dâun seul élémentTypedArray.BYTES_PER_ELEMENT:let arr = new Uint16Array(4); // Création d'un tableau typé de 4 entiers alert( Uint16Array.BYTES_PER_ELEMENT ); // 2 octets par entier alert( arr.byteLength ); // 8 (taille en octets) -
Sans arguments, il crée un tableau typé de taille nulle.
Nous pouvons créer un tableau typé directement sans fournir un ArrayBuffer. Mais une vue ne peut pas exister sans, donc il sera créé automatiquement dans tous les cas, sauf le premier (quand il est passé en argument).
Pour accéder au ArrayBuffer sous-jacent, il existe les propriétés suivantes dans TypedArray :
bufferâ qui fait référence à lâArrayBuffer.byteLengthâ qui correspond à la taille de lâArrayBuffer.
Donc nous pouvons toujours passer dâune vue à lâautre:
let arr8 = new Uint8Array([0, 1, 2, 3]);
// Une autre vue avec les mêmes données
let arr16 = new Uint16Array(arr8.buffer);
Voici une liste de tableaux typés:
Uint8Array,Uint16Array,Uint32Arrayâ Pour les entiers de 8, 16 et 32 bits.Uint8ClampedArrayâ Pour les entiers de 8 bits, avec une ârestrictionâ Ã lâaffectation (voir plus loin).
Int8Array,Int16Array,Int32Arrayâ Pour les nombres entiers signés (peuvent être négatifs).Float32Array,Float64Arrayâ Pour les nombres flottants signés de 32 et 64 bits.
int8 ou de types similairesMalgré la présence de noms tels que Int8Array, il nây a pas de type comme int ou int8 dans JavaScript.
Car en effet Int8Array nâest pas un tableau de ces valeurs individuelles, mais plutôt une vue sur ArrayBuffer.
Comportement hors limite
Que se passe tâil lorsque nous essayons dâécrire des valeurs en dehors des limites dans un tableau typé ? Il nây aura pas dâerreurs, mais les bits en trop seront supprimés.
Par exemple, essayons dâajouter 256 dans un Uint8Array. En binaire, 256 sâécrit 100000000 (9 bits), mais un Uint8Array ne permet que 8 bits par valeur, ce qui donne des valeurs possibles entre 0 et 255.
Pour les grands nombres, seuls les 8 bits les plus à droite (moins significatif) sont sauvegardés, et le reste est supprimé:
Donc nous allons obtenir 0.
Pour 257, lâécriture binaire est 100000001 (9 bits), les 8 bits les plus à droite sont gardés, donc on aura un 1 dans notre tableau:
En dâautres termes, Le nombre modulo 28 est sauvegardé.
Démonstration:
let uint8array = new Uint8Array(16);
let num = 256;
alert(num.toString(2)); // 100000000 (représentation binaire)
uint8array[0] = 256;
uint8array[1] = 257;
alert(uint8array[0]); // 0
alert(uint8array[1]); // 1
Uint8ClampedArray possède un comportement différent. Il garde 255 pour nâimporte quel nombre qui est plus grand que 255, et 0 pour nâimporte quel nombre négatif. Ce comportement est utile dans le traitement dâimages.
Méthodes des tableaux typés
TypedArray possède les méthodes de Array, avec quelques exceptions notables.
Nous pouvons itérer, map, slice, find, reduce etc.
Mais certaines choses ne sont pas possibles:
- Pas de
spliceâ On ne peut pas supprimer une valeur, car les tableaux typés sont des vues sur unbuffer, qui sont des zones fixes dans la mémoire. Tout ce que nous pouvons faire est de mettre un 0. - Pas de méthode
concat.
Il y a deux méthodes supplémentaires:
arr.set(fromArr, [offset])copie tous les éléments defromArrversarr, en commençant à partir de la positionoffset(0 par défaut).arr.subarray([begin, end])crée une nouvelle vue du même type debeginjusquâÃend(non-inclus). Câest similaire à la méthodeslice(qui est également disponible), mais elle ne copie rien â il sâagit juste dâune création dâune nouvelle vue, pour travailler sur un certain morceau de données.
Les méthodes nous permettent de copier des tableaux typés, de les mélanger, de créer des nouveaux tableaux depuis ceux existants, et bien dâautres choses.
DataView
DataView est une vue spéciale ânon typéeâ super flexible sur Ê»ArrayBuffer`. Il permet dâaccéder aux données sur nâimporte quel offset dans tous les formats.
- Pour les tableaux typés, le constructeur détermine le format. Le tableau entier est supposé être uniforme. Le i-ème nombre est noté
arr[i]. - Avec
DataViewnous accédons aux données avec des méthodes comme.getUint8(i)ou.getUint16(i). Nous choisissons le format au moment de lâutilisation de la méthode au lieu du moment de la création.
Voici la syntaxe:
new DataView(buffer, [byteOffset], [byteLength])
bufferâArrayBuffer. Contrairement aux tableaux typés,DataViewne crée pas soit même un buffer. Nous avons besoin de le lui fournir directement.byteOffsetâ Lâoctet de départ de la vue (par défaut à 0).byteLengthâ La taille totale de la vue en octets (par défaut jusquâà la fin debuffer).
Pour lâexemple, nous allons récupérer des nombres dans plusieurs formats avec le même buffer:
// Tableau binaire de 4 octets, tous ayant la valeur maximale - 255
let buffer = new Uint8Array([255, 255, 255, 255]).buffer;
let dataView = new DataView(buffer);
// récupération d'un nombre en 8 bits avec un décalage de 0
alert( dataView.getUint8(0) ); // 255
// récupération d'un nombre en 16 bits avec un décalage de 0, soit 2 octets, qui sont interprétés ensemble en 65535
alert( dataView.getUint16(0) ); // 65535 (Plus grand entier non signé en 16 bits)
// récupération d'un nombre en 32 bits avec un décalage de 0
alert( dataView.getUint32(0) ); // 4294967295 (Plus grand entier non signé en 32 bits)
dataView.setUint32(0, 0); // Fixe le nombre sous 4 octets à 0, fixant ainsi tous les octets à 0
DataView est utile lorsque lâon met des données sous plusieurs formats dans le même buffer. Par exemple, on stocke une séquence de paires (16-bit integer, 32-bit float). DataView nous permettra dây accéder facilement.
Résumé
ArrayBuffer est lâobjet au coeur de tout, câest une référence à une zone de taille fixe dans la mémoire.
Pour faire presque nâimporte quelle opération sur un ArrayBuffer, nous avons besoin dâune vue.
- Il peut sâagir dâun tableau typé:
Uint8Array,Uint16Array,Uint32Arrayâ pour les entiers non-signés de 8, 16, et 32 bits.Uint8ClampedArrayâ pour les entiers de 8 bits, âclampsâ them on assignment.Int8Array,Int16Array,Int32Arrayâ pour les entiers signés (peuvent être négatifs).Float32Array,Float64Arrayâ pour les nombres flottants signés de 32 et 64 bits.
- Ou dâun
DataViewâ la vue qui utilise des méthodes pour spécifier un format, e.g.getUint8(offset).
Dans la majorité des cas, on crée et on opère directement sur les tableaux typés, laissant ArrayBuffer en arrière. On peut toujours y accéder avec .buffer et faire une nouvelle vue si besoin.
Il y a également 2 termes supplémentaires, qui sont utilisés dans les descriptions des méthodes pour travailler sur les données binaires:
ArrayBufferViewqui est le terme pour tous les types de vues.BufferSourcequi est un terme désignant soit unArrayBufferou unArrayBufferView.
Nous verrons ces termes dans les prochains chapitres. BufferSource est lâun des termes les plus communs, qui veut dire âtoutes sortes de données binairesâ â un ArrayBuffer ou une vue par dessus.
Voici un cheatsheet :
Commentaires
<code>, pour plusieurs lignes â enveloppez-les avec la balise<pre>, pour plus de 10 lignes - utilisez une sandbox (plnkr, jsbin, codepenâ¦)