Title: Gestion de Fichiers
1Gestion de Fichiers
- Stockage Secondaire Disques
-
2Plan du cours daujourdhui
- Vue générale
- LOrganisation des disques
- Estimation de la capacité des disques
- Organisation des pistes par secteur
- Organisation des pistes par blocs
- Espace perdu à lorganisation
- Coût et amélioration de laccès au disque
- FZR, Chapitre 3.1
3 Vue générale
- Nous avons appris à manipuler les fichiers.
- Nous appredrons la nature et les limitations des
périphériques de stockage. - Etant donné un périphérique de stockage, ces
connaissances vont nous aider à créer des
structures de fichiers mieux adaptées à ces
périphériques et qui minimiseront le coût daccès
aux données.
4 Vue générale
- Périphériques à accès direct
- - Disques magnétiques
- disques durs haute capacité
- disquettes petite capacité
-
- - Disques optiques
- CD-ROM
-
- Périphériques à accès séquentiel
- - Cassettes magnétiques
5Vue générale sur les disques
- Il existe plusieurs types de disques
- Disques durs grande capacité petit coût
- Disquettes très bon marché, mais accès lent et
petite capacité (sauf pour les Disques Zip) - Disques Optiques (CD-ROM) seulement pour la
lecture, capacité énorme, bon marché à
reproduire, mais très lents
6Organisation des disques
- Linformation sauvegardée sur un disque est
sauvegardée sur la surface dun ou plusieurs
plateau (disque). - Linformation est sauvegardée sur des piste
successives sur la surface de chaque plateau. - Chaque piste est divisée en un nombre de secteurs
qui sont les portions les plus petites du disque
qui peuvent être referées. - Linformation est accessible par le bras qui
possède les têtes de lecture et décriture. - Voir Figures 3.1 et 3.2 dans le livre.
7Organisation des disques (suite)
- Lorsquune instruction de lecture cherche un
octet particulier dans un fichier sauvegardé sur
un disque, le système dexploitation de
lordinateur trouve la valeur du plateau, de la
piste et du secteur dans lesquels se trouve cet
octet il lit le secteur tout entier dans une
portion spéciale de la mémoire principale appelée
mémoire tampon et il cherche loctet dans la
mémoire tampon.
8Organisation des disques (suite)
- Lunité de disque a typiquement un nombre de
plateaux et de pistes logés directement les uns
sous les autres. Lensemble des pistes logées les
unes sous les autres sappelle un cylindre. - Les informations contenues sur le même cylindre
peuvent être accédées sans déplacer le bras de
lecture et décriture. - Déplacer ce bras sappelle rechercher (seeking)
et correspond à la portion la plus lente du
processus de lecture ou décriture sur disque.
9Estimation de la capacité dun disque
- Capacité dune piste nombre de secteurs par
piste X octets par secteur - Capacité dun cylindre nombre de pistes par
cylindres X capacité dune piste - Capacité dune unité de disque nombre de
cylindres X capacité dun cylindre
10Estimation de la capacité exemple
- Voici un problème caractéristique
- - On donne les caractéristiques dun fichier et
dun disque - - Question De combien de cylindres a-t-on
besoin
pour stocker ce fichier sur ce disque? - caractéristiques dun fichier
- enregistrements à longueur
fixe - denreg.
50,000 taille dun enreg. 256 octets - caractéristiques du disque
- doctets par secteur 512
de sect. par piste 63
- de pistes par cylindre 16
de cylindres 4092
11Estimation de la capacité exemple (suite)
- Réponse
- - 512/256 2 enregistrements par secteur
- - 2 X 63 126 enregistrements par piste
- - 16 X 126 2,016 enregistrements par cylindre
- - de cylindres 50,000/2,016 24.8 cylindres
- Note un disque peut ne pas avoir autant de
cylindres contigues disponibles. Conséquence ce
fichier peut être dispersé sur des centaines de
cylindres !
12 Organisation des pistes par secteurs
- Le Placement Physique des Secteurs
- Lorganisation la plus logique et pratique des
données dun fichier sur une piste de disque est
de faire en sorte que les données adjacentes du
fichier soient représentes par des segments de
piste de taille fixe adjacents sur le disque. - Dans le contexte de lorganisation physique,
cependant, cela nest pas optimal après avoir lu
des données, le contrôleur de disque a besoin de
temps pour traiter linformation reçue avant de
pouvoir en accepter de nouvelles. Si les secteurs
étaient physiquement adjacents, on perdrait le
début du secteur suivant en traitant
linformation précédente.
13 Organisation des Pistes par secteurs (suite)
- Solution Traditionnelle entrelacer les secteurs.
Cest-à-dire laisser un intervalle de plusieurs
secteurs physiques entre des secteurs logiques
adjacents. Voir Fig. 3.4. - On parle dentrelacement de 1 à 1, 2 à 1, 3 à 1,
etc. Voir à ce sujet la Figure 3.4 dans le livre.
Le facteur dentrelacement détermine le nombre de
révolutions de disque à effectuer. - De nos jours, cependant, la vitesse du contrôleur
sest tellement améliorée que, désormais,
lentrelacement nest plus nécessaire.
14Organisation des pistes par secteurs (suite)
- Le fichier peut aussi être conçu comme une série
de groupements (clusters) de secteurs
représentant un nombre fixe de secteurs
(logiques) contigus. - Une fois quun groupement est trouvé sur un
disque, tous les secteurs de ce groupement sont
accessibles sans recourir à une recherche
supplémentaire. - La table dallocation de fichiers (File
Allocation Table FAT Fig. 3.5) relie les
secteurs logiques aux groupements physiques
auxquels ils appartiennent.
15Organisation des pistes par secteurs (suite)
- Sil y a beaucoup despace libre sur un disque,
il peut être possible de représenter un fichier
entier par une série de groupements contigus. - Le fichier, dans ce cas, est dit être représente
par une étendue (extent). Il peut donc être
traité avec un montant minimum de temps de
recherche. - Si une etendue nest pas suffisante, alors on
peut diviser le fichier en plusieurs étendues. - Plus le nombre détendues augmente, plus le
fichier est dispersé sur le disque et plus il
requiert de temps de recherche.
16Organisation des pistes par secteurs (suite)
- Il y a deux organisations possibles pour les
enregistrements lorsque les enregistrements sont
plus petits que la taille dun secteur - Placer un enregistrement par secteur
- Placer les enregistrements successivement. ceci
peut forcer certains enregistrements à être
étendus sur deux secteurs.
17Organisation des pistes par secteurs (suite)
- Compensations (Trade-Offs)
- Avantage de 1 Chaque enregistrement peut être
récupéré dun seul secteur. - Désavantage de 1 De lespace est perdu dans
chaque secteur -- Fragmentation Interne. - Avantage de 2 pas de fragmentation interne.
- Désavantage de 2 2 secteurs peuvent être accédes
afin de ne récupérer quun seul enregistrement. - Lutilisation de groupements entraîne aussi de la
fragmentation interne lorsque la taille du
fichier nest pas un multiple de celle du
regroupement.
18 Organisation des pistes par blocs
- Plutôt que dêtre divisées en secteurs, les
pistes dun disque peuvent être divisées en blocs
définis par lusager. - Lorsque les données dune piste sont organisées
en bloc, cela veut dire, en général, que le
montant de données transférées lors dune seule
opération dentrée/sortie peut varier en fonction
des besoins de larchitecte du logiciel (et non
celui du hardware). - Les blocs peuvent normalement avoir une taille
fixe ou variable selon les spécifications de
larchitecte du système de fichiers et des
capacités du système dexploitation.
19 Organisation des pistes par blocs (suite)
- Les blocs nont pas les problèmes
denregistrements distribués sur 2 secteurs ni de
fragmentation interne puisque leur taille varie
de manière à accommoder lorganisation logique
des données. - Le facteur du bloc indique le nombre
denregistrements dun fichiers qui peuvent être
sauvegardés dans chaque bloc. - Chaque bloc est généralement accompagné de
sous-blocs le sous-bloc compte, le sous-bloc
clé, le sous-bloc de données. Certains sous-blocs
sont destinés à ladministration du bloc. Voir
Fig. 3.9 dans le livre.
20Espace perdu à lorganisation
- Que vous utilisiez une organisation par bloc ou
par secteur un certain montant despace du disque
est perdu à lorganisation. Cest-à-dire de
linformation sauvegardée sur le disque pendant
le pré-formatage. - Sur les disques adressables par secteurs, le
pré-formatage consiste à sauvegarder, au début de
chaque secteur, ladresse du secteur, de la
piste, et sa condition (utilisable ou defective)
des espaces et des marques de synchronisations
entre les champs dinformation afin daider le
mécanisme de lecture/écriture de les distinguer. - Dans les organisations par blocs, les sous-blocs
et les espaces dentre blocs doivent être fournis
avec chaque bloc.
21Espace perdu à lorganisation (suite)
- Relativement, lespace nécessaire pour
lorganisation dans lorganisation par bloc est
plus grand que dans lorganisation par secteur. - Plus la taille dun bloc grandit, plus le montant
de fragmentation interne sagrandit. - La flexibilité introduite par lutilisation de
blocs plutôt que de secteurs permet au
programmeur de déterminer assez librement comment
les données seront organisées physiquement sur le
disque. - LOrganisation en bloc néanmoins demande plus de
temps au programmeur et au système
dexploitation. - De plus, dans lorganisation en bloc, les
opérations dentrée/sortie ne peuvent pas être
synchronisées avec le mouvement du disque.
22Le coût dun accès au disque
- Le temps de recherche (seek time) temps requis
pour déplacer le bras jusquau cylindre demandé - Le délai de rotation (latency) temps pris par
le disque pour tourner afin de placer le secteur
demandé sous la tête de lecture/écriture - Le temps de transfert
( doctets transferrés / doctets sur
une piste) X temps de rotation
23Améliorer laccès au disque
- Les processus sont souvent limités par le disque
(disk-bound) cest-à-dire que le réseau et
lunité centrale doivent souvent attendre très
longtemps avant que le disque ne transmette les
données. - Solution 1 programmation multiple lunité
centrale travaille à dautres processus en
attendant le résultat du disque. - Solution 2 divisions (stripping) plusieurs
parties dun fichier sont divisées entre
différentes unités de disques, qui délivrent
toutes les parties du fichier en parallèle.
24Améliorer laccès au disque (suite)
- Solution 3 Utiliser un RAID (Redundant Array of
Independent Disks). - Solution 4 RAM disk ? Simule le comportement du
disque mécanique en mémoire. - Solution 5 disk cache ? Un large bloc de mémoire
configuré pour contenir des pages de données dun
disque. Le programme vérifie dabord le cache. Si
les données dont il a besoin ne sont pas dedans,
il va chercher les données dans le disque et
remplace lune des pages du cache avec la page du
disque contenant ces données.