La théorie des fichiers                                             

Accueil Sommaire Le cours WEB Outils les examens bts Cycle d'apprentissage


Remonter Exercices Aller plus loin QCM Langage algorithmique La description des fichiers Entrainement


 LES FICHIERS

Définition

Nature des informations

Les différents types d'articles 

Les caractéristiques des fichiers

La classification des fichiers

Accès 

Les organisations de fichier

 Résumé organisation et acces 


 Définition

On appelle fichier une collection organisée d'informations analogues de même structure.

 Un fichier se définit logiquement et physiquement :

Logiquement

                               Il comporte le même nombre d'articles que d'occurrences à caractériser.

            Physiquement

                               Plusieurs éléments interviennent :

                                               * Le support matériel

                                               * L'organisation des informations sur ce support 

Le  support de stockage sera choisi parmi l'ensemble des organes d'entrée/sorties.  L'enregistrement physique correspond à une unité de lecture du support (bloc). Sa taille s'évalue en nombre de caractères et dépend essentiellement de la taille de la zone réservée en mémoire centrale (buffer). 

Au niveau logique:

FICHIER: ensemble homogène d'articles relatifs à une même réalité de gestion.

ARTICLE: ensemble des rubriques qui décrivent les propriétés types d'un individu.

RUBRIQUE: information élémentaire significative.

Au niveau physique:

FICHIER: ensemble homogène d'articles relatifs à une même réalité de gestion.

ENREGISTREMENT: ensemble des zones qui décrivent les propriétés types d'un individu.

ZONE: information élémentaire significative.

retour


Nature des informations

              Les informations que nous trouvons dans les fichiers font partie de l'une des classes suivantes :

retour


Les différents types d'articles 

               Il existe deux types d'articles :

  • Articles de longueur fixe et de structure unique

  • Articles de longueur variable et de structure multiple

 Les articles de longueur fixe et de structure unique

C'est le cas le plus courant. Tous les articles d'un même fichier ont la même structure, le même nombre de rubriques et la même taille. 

AVANTAGE: Cette méthode a l'avantage de simplifier les accès aux données, en permettant notamment un accès direct à un certain enregistrement. A partir du numéro de cet enregistrement, on peut facilement calculer la position dans le fichier du premier octet correspondant à celui-ci: 

                 Position du premier octet de l'enregistrement sur le support = d + (n * t)

                 d:position du premier octet du fichier

                 n:numéro de l'enregistrement (à partir de zéro)

                 t:taille de l'enregistrement en octets 

INCONVENIENT: C'est le "gaspillage" de place sur le support. En effet une rubrique NOM de 20 caractères aura très souvent plusieurs espaces à droite et inversement les noms très longs seront tronqués. 

Les articles de longueur variable et de structure multiple

Il arrive que les articles d'un même fichier appartiennent à plusieurs entités différentes, ayant chacune sa propre structure.

                 ex: fichier client avec des personnes morales et des personnes physiques

                      personnes morales               personnes physiques

                     code                                               code

                     raison sociale                                  nom

                     numéro siret                                   numéro insee

                     ...                                                    ...

 

                 Afin de pouvoir différencier les articles, un code article est inséré en tête.

                 ex:          1 pour une personne morale

                                2 pour une personne physique 

Lors des opérations sur les fichiers, c'est au programmeur de tester le code article et d'utiliser la bonne description de l'article correspondant. 

Afin d'éviter la perte de place constatée précédemment, les articles n'auront plus que la longueur utile au stockage de leur propre information. La gestion de l'emplacement est à la charge du système d'exploitation.

Dans ce type d'enregistrement on réserve en tête une zone de longueur fixe contenant la valeur de la longueur de l'enregistrement total. Le même raisonnement est tenu pour une rubrique.

                 ex: rubrique NOM 20 caractères

                     DUPONT..............         (place 20 c)

                     devient

                     06DUPONT                     (place 8 c) 

Contrairement au système précédent il n'est pas possible de prévoir exactement le volume du fichier (dans la pratique on fait un calcul moyen et maximal), ni de calculer la position d'un enregistrement. 

Pour pouvoir retrouver un enregistrement on utilise un système d'index basé sur la clé d'accès.

NOTION DE CLE D'ACCES           

On aura besoin de consulter, modifier, supprimer, ajouter des enregistrements. Pour cela il est nécessaire de disposer d'un moyen de trouver l'enregistrement à traiter :

Chacun doit avoir une zone dont la valeur le distingue totalement des autres enregistrements du fichier. 

                 ex: fichier résultat d'examen

                     NOM, PRENOM, ANNEE EXAMEN

                 Ces trois rubriques définissent LA CLE D'ACCES de l'enregistrement :

La clé d'accès d'un enregistrement est un attribut ou un groupe d'attributs qui définissent un enregistrement de manière unique. Remarquons qu'il y a souvent plusieurs clés possibles ; toutes ne sont pas équivalentes.

ex: "nom+prénom+année" exclue la possibilité que 2 élèves homonymes passent leur examen la même année : En effet, si le cas se produisait, notre système informatique serait incapable de distinguer les deux élèves. Pour être sur de ne pas rencontrer ce problème sans que la clé ne soit la concaténation de la majorité des rubriques, on préfère ajouter une rubrique artificielle "numéro" qui n'a d'autre rôle que celui de clé. 

                 ex:numéro de résultat constitué par année et numéro d’INSEE 

retour


Les caractéristiques des fichiers

Les fichiers connaissent au cours de leur vie différentes phases. Ils sont tout d'abord écrits et organisés sur le support : c'est la CREATION du fichier. Par la suite, des informations périmées y sont supprimées ou modifiées, de nouvelles y sont insérées, c'est la MISE A JOUR. Enfin, pendant toute la durée de vie du fichier, les articles sont lus pour fournir des informations, c'est la CONSULTATION.

 

Taux de consultation :

               C'est le rapport entre le nombre d'articles consultés par traitement et le nombre total d'articles dans un fichier. 

               Tx = n / N

               Tx:taux de consultation

               n :nombre d'articles accédés durant la période de temps T

               N :nombre d'articles du fichier 

Fréquence d'utilisation:

               c'est le nombre de fois qu'un fichier intervient dans des traitements pendant une période déterminée. 

               F = n / T 

               F:fréquence d'utilisation

               n:nombre d'utilisation d'un fichier durant une période de temps T

               T:période de temps 

Taux d'accroissement:

               c'est le pourcentage d'articles ajoutés à un fichier pendant dans un traitement. 

retour


La classification des fichiers

Les caractéristiques des fichiers, les utilisations qui en sont faites et la durée de vie des informations qu'ils contiennent permettent de les répartir en plusieurs catégories:

 Les fichiers permanents:

Ils contiennent des informations vitales pour l'entreprise. Ces informations sont vivantes, évoluent constamment afin de rester le fidèle reflet de la situation.

Ils se caractérisent par:

                     - une fréquence d'utilisation élevée

                     - des mises à jour périodiques

                     - une durée de vie illimitée 

 Les fichiers historiques:

Ils contiennent les archives de l'entreprise. Ces fichiers sont consultés pour fournir des renseignements comparatifs ou pour rechercher une information ponctuelle.

Ils se caractérisent par:

                      - un taux de consultation élevé

                      - une fréquence d'utilisation faible

                      - un taux d'accroissement important

                      - un taux de suppression nul

                      - une durée de vie correspondant au type d'activité 

 Les fichiers mouvements:

Ils contiennent des informations récentes dont la durée de vie est courte et qui permettent principalement la mise à jour des fichiers permanents. 

Les fichiers de manœuvre,travail:

Ils contiennent en général des informations dont la durée de vie est très courte, souvent de l'ordre de l'exécution d'un programme. 

Les fichiers tables,paramètre:

ils contiennent les codes et les libellés utilisés par l'application. ils permettent des gains disque important et limitent la maintenance de l'application.      

retour


Accès 

L'accès aux informations du fichier.

Il existe essentiellement deux méthodes d'accès aux enregistrements d'un fichier: L'accès séquentiel et l'accès direct. 

 L'accès séquentiel

L'accès à un article n'est possible qu'après consultation successive de tous ceux qui le précèdent sur le support: Il faut donc, pour consulter le N ème article lire les N-1 articles. Cette méthode est toujours possible quel que soit le type de support. 

L'accès direct(ou sélectif)

L'accès à un article se fait de façon immédiate, par connaissance de l'adresse précise de la zone dans laquelle l'article est enregistré. 

retour


Les organisations de fichier

L'organisation représente son mode d'implantation physique sur le support. Il existe quatre grands types d'organisation de fichier:

                    - L'organisation séquentielle physique ou chaînée

                    - L'organisation directe

                    - L'organisation séquentielle indexée                    

 L'organisation séquentielle physique

Elle correspond à l'implantation consécutive des informations dans l'ordre suivant lequel elles ont été introduites. Elle permet uniquement l'accès séquentiel aux enregistrements ainsi organisés. 

L'organisation séquentielle chaînée

Les articles sont reliés entre eux par un chaînage. Il faut donc rajouter à chaque article un pointeur sur le suivant. Il est important de connaître l'adresse du premier de la liste. Le dernier article porte une  marque de fin. Cette organisation ne convient qu'aux supports adressables. 

L'organisation directe

Chaque article est implanté à une adresse précise du support. Le principe de cette organisation consiste à faire correspondre une adresse à une clé et inversement, sans aucune ambiguïté. Cette organisation ne convient qu'aux supports adressables.

Il existe différents procédés pour réaliser cette correspondance:

L'adressage direct(organisation directe)

c'est la solution la plus simple: elle consiste à utiliser la clé comme adresse de rangement. Cetteméthode est intéressante lorsque les indicatifs sont consécutifs, la place disque est optimisée.Dans le cas contraire(clé non consécutive) elle engendre des pertes importantes en espace disque.

L'adressage par table

Consiste à associer à chaque clé une adresse physique par l'intermédiaire d'une table qui contient toutes les clés et leurs adresses correspondantes. Cette table est mémorisée en tête de fichier.

L'adressage calculé

C'est la méthode qui permet d'enregistrer un article à une adresse déterminée par calcul à partir de la clé. Le calcul ainsi appliqué est appelé algorithme de randomisation.

 

L'organisation séquentielle indexée

Cette organisation se caractérise par:

  • L'écriture consécutive des enregistrements sur le support au fur et à mesure de leur insertion dans le fichier.

  • La constitution simultanée d'une table d'index.

La transformation clé-adresse ainsi que la gestion du fichier index sont entièrement à la charge du système. certains systèmes autorisent plusieurs index sur un fichier (multi-index ou multi-clé) 

retour


 Résumé organisation et acces 

retour