Nu kan nästan vem som helst med abonnemang och passande utrustning leta fakta i hundratals allmänt tillgängliga databaser världen över. Bara i Europa finns ca 2000 databaser av varierande slag.
I denna artikel beskriver P G Holmlöv, civilekonom vid Handelshögskolan i Stockholm, hur man tar sig fram i denna informationsspäckade nya datavärld.
Tänk om allt som trycks – böcker och tidningar, årsredovisningar, reservdelskataloger, patentansökningar, tidtabeller och regeringspropositioner – kunde lagras digitalt (som ”nollor” och ”ettor”) på något datamedium så att det sedan kan återsökas av intresserade läsare!
Så händer redan – nästan. Många av de texter som trycks i vanliga tryckerier, eller som skrivs ut av företag och myndigheter, passerar och lagras i ordbehandlare, datorer och sättmaskiner – d v s det lagras digitalt. Allt av detta kan inte återsökas någorlunda enkelt, eftersom man inte automatiskt kopplar ihop varje dokument eller självständig enhet i dokumentet med några slags sökbegrepp som är enhetliga och lätta att förstå. Men en hel del lagras redan, direkt eller efter viss bearbetning i svenska och utländska databaser av olika typ.
Databaser har funnits länge, och var tidigare förbehållna dokumentalister, bibliotekarier och specialister av olika slag. Det nya är att nu kan nästan vem som helst – med abonnemang, beskrivande manual och passande utrustning – leta i hundratals allmänt tillgängliga databaser med miljoner faktauppgifter.
Vad är databaser?
En databas är en förteckning med ett antal faktauppgifter som lästs in på ett datamedium och som sedan kan återsökas.
Faktauppgifterna kan vara tal i tabellform (t ex flygtidtabeller, börskurser, försäljningsdata, BNP-statistik eller årsredovisningar), s k ”referenser” (d v s hänvisningar till tryckta källor med mer utförlig information) samt fullständiga textavsnitt av typen hela artiklar i uppslagsböcker och tidskrifter. Varje sådan uppgift – tabell, referens eller t o m artikel – kallas på engelska ett ”record”.
Med ”datamedium” menar man vanligen att uppgifterna finns lagrade på magnetband i en stordator så att de kan återsökas genom att användaren ringer upp databasen – ”on line” – sökning.
Återsökning innebär att användaren kan leta fram uppgifter – ”records” – som han eller hon tror kan vara intressanta, och sedan låta skriva ut eller skriva av alla eller några beställda uppgifter. I en ”relations”-databas skriver och kombinerar användaren ett eller flera sökord, som han/hon formulerar själv eller väljer från en beskrivning av databasen.
Några databaser
En databas konstrueras och upprätthålls vanligen av ett enskilt företag som normalt lagrar, eller erhållit rätten att lagra, en viss typ av uppgifter på datamedium. Utvecklingen går mot att många sådana databaser förs samman i en eller flera datorer av en s k databasvärd. Databasvärden svarar då för alla kundkontakter och ser till att användarna kan söka i många databaser genom samma kanal (samma telefonnummer, samma ”inloggningsprocedur”) och med likartat sökspråk.
Världens kanske största databasvärd är amerikanska Dialog i Palo Alto, Kalifornien, som ägs av storföretaget Lockheed. Dialog innehåller mellan 200 och 300 databaser, av vilka många samtidigt förekommer hos andra databasvärdar. Databaserna innehåller tillsammans över 100 miljoner ”records” (av varierande slag) och uppdateras ständigt.
Naturligtvis är databaserna i Dialog av mycket varierande karaktär. De flesta är USA-baserade och domineras av information från amerikanska källor och om amerikanska förhållanden.
Man kan nämna en lång rad vetenskapliga databaser – samhällsvetenskap, kemi, biovetenskap, geovetenskap, medicin, farmakologi och ingenjörsvetenskap – liksom databaser som behandlar företag och branscher ur en lång rad aspekter – företagsnytt, branschfakta, marknadsundersökningar, finansiella uppgifter, årsredovisningar, börskurser, ägarförhållanden, adresser och telefonnummer, patent, produkter, reklam, prognoser och statistik. Dessutom finns APs och UPIs nyhetstelegram löpande, liksom boktitlar utgivna av Wiley, broschyrer m m som utges av federala myndigheter och alla artiklar i Harvard Business Review – i fulltext.
Dialog innehåller också en databas med information om innehållet 1 2 800 olika databaser, varav bara en liten del finns i själva Dialog. I en annan databas kan användaren leta igenom flera olika databaser som finns i Dialog för att se hur många ”records” av en viss typ – som svarar mot ett eller flera sökord – som finns i varje databas.
I Europa finns ca 2 000 databaser av varierande slag och ett 50-tal databasvärdar.
I Sverige kan man nämna bl a databaserna DataArkiv och AffärsData som kombinerar menysystem med användning av sökord. DataArkiv och AffärsData innehåller adresser och uppgifter om företag, nyhetstelegram respektive referenser till artiklar i affärstidningarna.
Kontrakt med databasvärden
Innan användaren börjar söka information i någon databas måste han eller hon teckna abonnemang med databasvärden. Därefter erhåller man en lista över olika telefonnummer till databasen, lösenord (ett eller flera) och kundnummer.
Vanligen får abonnenten betala för manualer och annat informationsmaterial från databasvärden, som bl a beskriver hur man tar sig in i databasen (”inloggningsförfarande”) och hur man söker information (”sökspråk” och innehåll i databasen m m). Dessutom anordnar databasvärden olika kurser för användare.
Databasanvändningen debiteras enligt någon eller båda av två principer. Ett sätt är att debitera användaren för hur lång tid han eller hon är uppkopplad till databasen, oavsett hur omfattande sökningar som genomförs. Ett annat sätt är att debitera användaren efter i vilken utsträckning som datorns beräkningskapacitet används (”CPU-tid”).
Vilken utrustning?
För att kunna ringa upp och leta information i en databas behöver användaren ett telefonabonnemang med telefon, en dataterminal eller smådator som kan anslutas till telefonnätet samt ett modem (förkortning av ”modulator-demodulator”).
Modemet kopplar ihop terminalen eller smådatorn med telefonen, och behövs för att omvandla telefonsignalerna till tecken som kan läsas på bildskärmen (och tvärtom). Modem kan köpas eller hyras från televerket, t ex (vissa enklare) i Telebutikerna, eller köpas av andra distributörer och tillverkare.
Smådatorn eller dataterminalen som används måste kunna kommunicera ”asynkront”, vilket framför allt de flesta IBM-terminaler inte gör (IBM PC kan göra det). Om det är fråga om en dator, måste den också utrustas med ett särskilt kommunikationsprogram, en diskett som tillåter datorn att uppföra sig som – ”härma” eller ”emulera” – en terminal vid databassökningen. Användaren måste vanligen på förhand specificera – t ex genom att fylla i ”blanketter” på bildskärmen – vilka tekniska regler – ”parametrar” – som skall användas för datakommunikationen, t ex vad backstegstangenten skall betyda, om sidbrytning skall sändas o s v.
För IBM PC och kompatibla smådatorer, t ex Ericsson PC, finns en särskild programvara som heter AviTel. Användaren gör upp en egen ”telefonbok” i AviTel genom att på förhand skriva in telefonnummer, överföringshastighet och t o m lösenord o s v så att ”inloggningen” i databasen kan gå enkelt till. AviTel består av en diskett som skjuts in i persondatorn vid varje användningstillfälle samt ett kretskort som monteras in i datorn. Kortet fungerar som (ersätter) modem och gör att datorn själv ringer upp och loggar in på respektive databas som användaren på förhand angivit i ”telefonboken”. Användaren kan sedan spara hela eller delar av databasdialogen för att senare titta på den, redigera den (främst kopiera delar av den) och/eller skriva ut den på skrivare som ansluts till persondatorn.
Motsvarande programpaket för Apple Macintosh heter AviTerm och består då av en diskett och ett speciellt modem.
Hur ringer man upp databasvärden?
Många databaser och databasvärdar kan nås genom flera olika datanät som är av typen ”paketförmedlande” (”packet switching”) nät, d v s informationen kodas digitalt (i dataspråkets ”nollor” och ”ettor”) ”packas” ihop med andra datasamtal och skickas i en och samma telefonkanal. Som resultat blir överföringen billigare än om användaren skulle ringa upp databasen direkt.
Databasvärdarna medger vanligen två olika överföringshastigheter – 300 eller – 1 200 bitar per sekund, bps. Man har olika ingångar till datorn med olika telefonnummer som används för respektive hastighet. (Bitar är dataspråkets ”nollor” och ”ettor”, och varje tecken – bokstav eller siffra – motsvaras av 810 bitar.) Det går alltså snabbare att kommunicera med 1 200 bps, men det modem som behövs är större och kostar mer. En del modem är omställbara till olika hastigheter.
En del databasvärdar har dessutom ingångar till datorn som tillåter datakommunikation i hastigheten 75/1200 (”split speed”), d v s användaren skriver lösenord, sökbegrepp o s v i 75 bps medan utskrifterna på skärmen från databasen sker så snabbt som 1 200 bps, d v s ungefär så snabbt som användaren hinner läsa. Den hastigheten används annars i videotex, t ex Datavision, och finns för en del svenska och utländska databaser av annan typ för att användare med speciella videotex-terminaler skall kunna abonnera på dem också.
I USA ringer användaren oftast en lokal ”ingång” – ”nod” – till något paketnät. I Europa behöver man vanligen ha ett särskilt abonnemang för att använda ett paketnät för att nå utländska databaser, och teleadministrationerna säljer sådana abonnemang. Svenska televerket erbjuder abonnemang i Datapak, som är ett sådant paketnät genom vilket man kan nå svenska och utländska databaser. För detta betalar användaren en ingångsavgift och en kvartalsavgift till televerket, oavsett hur mycket Datapak sedan används, kostnaden för ett lokalsamtal till Datapak i det vanliga telefonnätet och en tids- och teckenbaserad taxa som blir ungefär en femtedel av vad ett normalt telefonsamtal skulle kosta till databasen i fråga.
Andra databasvärdar, t ex I P Sharp, har egna internationella paketnät: de hyr ledningar av televerken i olika länder och använder dessa för att distribuera digital datatrafik, t ex förfrågningar och sökningar i databaser.
Hur söker man i databaser?
När man har nått den databas som man vill söka i – i Dialog sker detta genom att man skriver ”BEGIN 00” eller ”B 00”, där 00 är numret på den databas som man vill åt – anger man ett eller flera sökord som skall återfinnas i rubriken, i speciella ”sökfält” eller helt enkelt någonstans i textmassan i ett visst ”record”.
Om man vill kombinera flera sökord, måste man binda ihop dem med logiska begrepp och/eller begrepp som anger hur nära varandra sökorden skall finnas i texten. De logiska begreppen hämtas från vanlig mängdlära – ”Booleansk algebra” – men benämns olika i olika databaser.
I Dialog använder man begreppen OR för att beteckna och/eller (union), AND för att beteckna både/och (snittmängd) och NOT för att beteckna att man inte vill begära fram ”records” där det angivna sökordet finns med. Om man är osäker på hur ord stavas i databasen, eller om man letar efter en ordstam som har flera böjningar, anger man med ett eller flera ? att ordet kan fortsättas på vilket sätt som helst.
När sökningen bekräftats genom att användaren gjort radframmatning (tryckt på ENTER, RETURN eller motsvarande tangent) dröjer det en ganska kort stund innan databasen på bildskärmen anger hur många ”records” som svarar mot varje sökord som ingår i sökningen respektive mot kombinationen av sökord. För varje sökord eller kombination av sökord bildas tillfälligt en grupp av ”records” – ett ”set” som har ett visst nummer i den speciella uppkopplingsomgången, S1, S2, S3 o s v.
För att se innehållet i ett eller flera ”records” skriver användaren DISPLAY setnummer/format/nummer inom setet, t ex ”D 1/5/1–3” för att på bildskärmen få se ”record”-nummer 1, 2, och 3 i det första setet i utskriftsformat 5, nämligen den mest fullständiga versionen. (Utskriftsformat varierar mellan olika databaser.)
Uppgifterna kan också tryckas ut ”off-line”, hos Dialog, och postas till användaren, om han eller hon begär det genom att i stället skriva ”PRINT”. Dessutom kan andra uppgifter beställas i Dialog från tillhandahållaren av en viss databas eller från andra företag.
P G Holmlöv, civ ek, Handelshögskolan i Stockholm