Tutoriale ORACLE - Introducere în ORACLE
Date, informații, cunoștințe
Auzim adesea vorbindu-se despre “Era informațiilor” sau “societate informațională” sau “tehnologia informației” însă de multe ori cuvântul "informație" este folosit fără a înțelege clar sensul acestui cuvânt, diferența dintre date, informații, cunoștințe.
În general, conținutul gândirii umane operează cu următoarele concepte:
1. Date – constau în material brut, fapte, simboluri, numere, cuvinte, poze fără un înțeles de sine stătător, neintegrate într-un context, fără relații cu alte date sau obiecte. Ele se pot obține în urma unor experimente, sondaje etc.
2. Informații – prin prelucrarea datelor și găsirea relațiilor dintre acestea se obțin informații care au un înțeles și sunt integrate într-un context. Datele organizate și prezentate într-un mod sistematic pentru a sublinia sensul acestor date devin informații. Pe scurt informațiile sunt date prelucrate. Informațiile se prezintă sub formă de rapoarte, statistici, diagrame etc.
3. Cunoștințele sunt colecții de date, informații, adevăruri și principii învățate, acumulate de-a lungul timpului. Informațiile despre un subiect reținute și înțelese și care pot fi folosite în luarea de decizii, formează judecăți și opinii devin cunoștințe. Cu alte cuvinte, cunoștințele apar în momentul utilizării informației .
Colectarea și analizarea datelor. Modelul conceptual
Primul pas în realizarea unei aplicații de baze de date este analiza datelor și realizarea unei scheme conceptuale (model conceptual) al acestor date.
În această etapă sunt analizate natura și modul de utilizare a datelor. Sunt identificate datele care vor trebui memorate și procesate, se împart aceste date în grupuri logice și se identifică relațiile care există între aceste grupuri.
Analiza datelor este un proces uneori dificil, care necesită mult timp, însă este o etapă absolut obligatorie. Fără o analiză atentă a datelor și a modului de utilizare a acestora, vom realiza o bază de date care putem constata în final că nu întrunește cerințele beneficiarului. Costurile modificării acestei baze de date este mult mai mare decât costurile pe care le-ar fi implicat etapa de analiză și realizare a modelului conceptual. Modificarea modelului conceptual este mult mai ușoară decât modificarea unor tabele deja existente, care eventual conțin și o mulțime de date. Ideea de bază a analizei datelor și construirii modelului conceptual este "să măsori de două ori și să tai o singură dată".
Informațiile necesare realizării modelului conceptual se obțin folosind metode convenționale precum intervievarea oamenilor din cadrul organizației și studierea documentelor folosite.
Odată obținute aceste informații ele trebuiesc reprezentate într-o formă convențională care să poată fi ușor înțeleasă de toată lumea. O astfel de reprezentare este diagrama entități-relații, numită și harta relațiilor, sau ERD-ul (Entity Relationship Diagram). Aceste scheme sunt un instrument util care ușurează comunicarea dintre specialiștii care proiectează bazele de date și programatori pe de o parte și beneficiari, pe de altă parte. Aceștia din urmă pot înțelege cu ușurință o astfel de schemă, chiar dacă nu sunt cunoscători în domeniul IT.
În concluzie putem sublinia câteva caracteristici ale ERD-urilor:
- sunt un instrument de proiectare
- sunt o reprezentare grafică a unui sistem de date
- oferă un model conceptual de înalt nivel al bazelor de date
- sprijină înțelegerea de către utilizatori a datelor și a relațiilor dintre acestea
- sunt independente de implementare.
În cele ce urmează vom prezenta principalele elemente care intră în componența unui ERD precum și convențiile de reprezentare a acestora.
Entități. Instanțe. Atribute. Identificator unic.
O entitate este un lucru, obiect, persoană sau eveniment care are semnificație pentru afacerea modelată, despre care trebuie să colectăm și să memorăm date. O entitate poate fi un lucru real, tangibil precum o clădire, o persoană, poate fi o activitate precum o programare sau o operație, sau poate fi o noțiune abstractă.
O entitate este reprezentată în ERD printr-un dreptunghi cu colțurile rotunjite. Numele entității este întotdeauna un substantiv la singular și se scrie în partea de sus a dreptunghiului cu majuscule, ca în figura I.1.1.
O entitate este de fapt o clasă de obiecte și pentru orice entitate există mai multe instanțe ale sale. O instanță a unei entități este un obiect, persoană, eveniment, particular din clasa de obiecte care formează entitatea. De exemplu, elevul X din clasa a IX-a A de la Liceul de Informatică din localitatea Y este o instanță a entității ELEV.
După cum se vede pentru a preciza o instanță a unei entități, trebuie să specificăm unele caracteristici ale acestui obiect, să-l descriem (precizăm de exemplu numele, clasa, școala etc). Așadar, după ce am identificat entitățile trebuie să descriem aceste entități în termeni reali, adică să le stabilim atributele. Un atribut este orice detaliu care servește la identificarea, clasificarea, cuantificarea, sau exprimarea stării unei instanțe a unei entități. Atributele sunt informații specifice ce trebuie cunoscute și memorate.
De exemplu atributele entității ELEV sunt nume, prenume, adresa, număr de telefon, adresa de email, data nașterii etc.
În cadrul unui ERD, atributele se vor scrie imediat sub numele entității, cu litere mici. Un atribut este un substantiv la singular (vezi figura I.1.2).
Un atribut poate fi obligatoriu sau opțional. Dacă un atribut este obligatoriu, pentru fiecare instanță a entității respective trebuie să avem o valoare pentru acel atribut, de exemplu este obligatoriu să cunoaștem numele elevilor. Pentru un atribut opțional putem avea instanțe pentru care nu cunoaștem valoarea atributului respectiv. De exemplu atributul email al entității ELEV este opțional, un elev putând să nu aibă adresă de email. Un atribut obligatoriu este precedat în ERD de un asterisc *, iar un atribut opțional va fi precedat de un cerculeț o.
Atributele care definesc în mod unic instanțele unei entități se numesc identificator unic (UID). UID-ul unei entități poate fi compus dintr-un singur atribut, de exemplu codul numeric personal poate fi un identificator unic pentru entitatea ELEV. În alte situații, identificatorul unic este compus dintr-o combinație de două sau mai multe atribute.
De exemplu combinația dintre titlu, numele autorului și data apariției poate forma unicul identificator al entității CARTE. Oare combinația titlu și nume autor nu era suficientă? Răspunsul este NU, deoarece pot exista de exemplu mai multe volume scrise de Mihai Eminescu având toate titlul Poezii, dar apărute la date diferite.
Atributele care fac parte din identificatorul unic al unei entități vor fi precedate de semnul diez # (figura I.1.2 și I.1.3). Atributele din UID sunt întotdeauna obligatorii, însă semnul # este suficient, nu mai trebuie pus și un semn asterisc în fața acestor atribute.
Valorile unor atribute se pot modifica foarte des, ca de exemplu atributul vârstă. Spunem în acest caz că avem de a face cu un atribut volatil. Dacă valoarea unui atribut însă se modifică foarte rar sau deloc (de exemplu data nașterii) acesta este un atribut non-volatil. Evident este de preferat să folosim atribute non-volatile atunci când acest lucru este posibil.