• Nem Talált Eredményt

Optikai karakterolvasó rendszerek könyvtári alkalmazása megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Optikai karakterolvasó rendszerek könyvtári alkalmazása megtekintése"

Copied!
10
0
0

Teljes szövegt

(1)

O P T I K A I KARAKTEROLVASÓ R E N D S Z E R E K KÖNYVTÁRI A L K A L M A Z Á S A

Teles A ndrás

VITA Ki:m \ tára

A könyviári számítógépes rendszerek kialakításá­

nak eddigi akadályai közül egy elhárulni látszik:

kisebb-nagyobb számítógepek jutnak mind több könyvtárunk birtokába. A helyi szellemi erők és az anyagi háttér kérdése most már az, hogy milyen programok lógják az egyes könyviári munkafolya­

matokai megkönnyíteni. Mint Ungváry Rudolf a Magyar Könyvtárosok Egyesülete rendezésében 1987-ben tartott előadásában kifejtette, semmit nem ér a számítógép program, mégpedig jó program nélkül Tegyük azonban mindjárt hozzá, hogy adatok nélkül sem a számítógép, sem a program nem ér sokat. Magyarországon egyelőre még kevés a géppel kezelhető bibliográfiai adatok, adatbázisok száma. Ahhoz tehát, hogy számítógépeink, prog­

ramjaink megkönnyítsék a könyvtári munkát és nö­

veljék az olvasóknak nyújtott szolgáltatások szinvo­

nalat, a katalógusok adatait gépre kell vinni. Ez pedig nem könnyű feladat. Abban a szerencsés hely­

zetben vagyunk, hogy a technikai feltételek lassan beérnek a feladat megvalósítására, jó ötletek közül válogathatunk, hogyan is fogjunk hozzá. Talán az is a javunkra válik, hogy nagy könyvtáraink a könyv­

tárgépesítés! program elején tartanak, s még nem kötelezték el magukat egyik vagy másik adatrögzítő eljárás mellett. A jelen írás segítséget kíván nyújtani a célravezető döntés meghozatalához. Biztatásul az

/. ábrán néhány nehezen olvasható katalóguscédu­

lát mutatunk be, a 2. ábrán pedig azt az e r e d m é n y t , amelyet az OPT1RAM/LIBPACK* rendszer

(Anglia) segítségével készítettek róluk. A számítás­

technika jelenlegi fejlettsége lehelövé leszi régi ka­

talóguscéduláink adatainak gépi úton való elolvasá­

sát és a bibliográfiai adatbázisba való betöltéséi. így katalógusaink visszamenőleges gépre vitele nem látszik r e m é n y t e l e n , távoli vállalkozásnak.

Az itt kifejteit javaslatunk az Informatikai Infra­

struktúra Fejlesztés (HF) keretében folyó könyvtár­

gépesítés! munkálatok egyik alapvető, általánosan jelentkező feladatára, a meglévő katalógusok adatai­

nak rögzítésére vonatkozik.

Tisztában vagyunk azzal, hogy a megvalósításra váró feladat igen nagy igényű még akkor is, ha csak egy máshol már m ű k ö d ő rendszer adaptálására kerül sor. Nem térünk ki most a rendszerből kínál­

kozó egyéb felhasználási lehetőségekre (pl. C A D — computer aided design — céljaira tervrajzok beolva­

sása vagy egy-egy szótár anyagának feldolgozása), mert figyelmünket a könyvtári katalógusok kérdése­

ire összpontosítjuk.

A jav aslat lényege

Az IIE program egyik fő célja a K + F tevékenység információs igényeinek magasabb szinten való ki­

elégítése. A könyvtári állományokat feltáró eszkö­

zök egyelőre elhanyagolható része van számítógép­

pel kezelhető adathordozón. Ahhoz, hogy ezek a ka­

talógusok és egyéb nyilvántartások megfelelhesse­

nek az I I F követelményeinek, jelentős információs

" A szerző a tanulmány leadása után értesüli arról a L I B P A C K Compuier Services vezelőjétöl. hogy a program fejlesztése si­

kertelenül zárull A? O P T I K A M-DI kél egyelem kónyviárá- ban is kipróbállak de az eljárás nem bizonyult cleg haiékonv nak. Az ulólagos javítások lúl sok időt és köllségcl c m é s z t e l - tek föl. — Minde/ck ismerőiében adjuk közre javaslat un kai.

felhiva a figyelmei az ismercies és nem kis nehézségekre, másrészi arra, hogy 1985 óla jelentős fejlődés kóveikezetl be (pl. a C D - R O M megjelenése), új megoldások is szüléitek, amelyek alkalmazása riövelheli a javasolt rendszer várható teljesítményét.

(2)

I elcs A.: Optikai karaktérólva$0 rendszerek.

• I o n n a l O k a j i s n . . .

OíilUlt IraiYEÜlW.

í t t l « « » t l c t l J o u m i l . »ol. 12- is«;.

O k a j í . M . J . C . X . U h .

O p o r t o . . .

C P O Í T Q U K l v i a i l T r . r A C U U U T J B D E S C I E S C I A S .

A n t i i d » r i c u l ű a d i d l S e l m á i n . V o l l . 1 4 - J 9 . 1 9 3 0 - 3 9 .

D p o r t O . J C » L i l i .

••• Tor p r v c v d l n g i i a u i * • • * C P O H T O . A C A D K H I A P O H T J X X I C A . A n n i n i t U i l i r i e o i ,

Jojrul

T r l » l * . . .

T R I t £ T £ U i u v * r l i t y . I l l l t u t o d i K l ( * A i t l u ,

R i n d i c o n i 1 . V a l . 1 - 1 9 6 9 -

. T r t a l t * . J C H L l b .

/. íihta

vagyonukat előbb vagy utóbb számitógépes adathor­

dozóra kell vinni. Ez a feladat pedig csak egy adap­

tív, intelligens és interaktív adatfelviteli rendszer k i ­ fejlesztésével oldható meg. A rendszer a következő főbb elemekből állna:

• m e c h a n i k u s a d a g o l ó ,

• optikai karakterolvasó berendezés, amely kb.

2000 karakter/s. azaz 4 kalalóguskártya/s teljesít­

m é n y r e képes,

• adaptív karakterfelismerő program,

• a bibliográfiai és a formai elemekei elhatároló adattárolási program.

• nyelvi és bibliográfiai háttér-adatbázisok és keze­

lőprogramjaik.

• helyi hálózat a többterminálos adatrögzítéshez,

• az adatjavítás és -rögzítés hálózati programja.

A fenti komponensekből álló rendszernek képes­

nek kell lennie arra, hogy

• kvázihomogén írásképű, rossz minőségű kártyá­

kat is elolvasson;

• a bevitt adatokat konvertálható struktúrában tá­

rolja;

• a feldolgozást 60 —70%-ban teljesen automatiku­

san, 20 — 25%-ban ellenőrzéssel, ül. apró javítás­

sal végezze el, s csak a tételek 5 —10%-ánál legyen szükség az adott tétel újbóli rögzítésére részben vagy egészben;

• olyan sebességet produkáljon, amely lehetővé teszi 1—2 milliónyi tétel egy évnél rövidebb idő alatt való feldolgozását (kb. 2000 katalóguskár­

tyát egy óra alatt, vagy 2 másodpercenként kb.

egy kártyát).

H i n t — c i c c o i o - M I T I I F I L Í u f o n e D i i t a a t f i c i

[ J U t , 3 1 i n ) . . , „ , 0 0 1 i l i r i l ! . .. P I 0 « - « T I M / C L I I S • I 0 O Í O 1 0 ' I I I • l " S l / l i U i l « M » D I 0 • • • / • . / • • 0 0 1 El 1 1 0 1 1 1 I

íti.J E l l i t n i p i l l c i l J e u r i ' L l » J . . . -. -1 L 1 . I ISi C l l o l . lt~ I l i i - •

J I O f i D k i r u i ' 1 1 0 , 1 1 E l D k l J " ! J n l, , ^ É l T r •

B& tt 1 E l j : > i l l l l ' I B Ei» i h t l v i d #1 1 t k , i H . . . i » J t u r i u l

; ; . „ „ . , 0 . - I P 1 0 0 1 t M I H i • 1 M 0 I • . n I I K H l . i l - > . 1 0 H E D l a F I L C - l l / O I / l l L I I I I J U N Í E O • . . / . . / - . DOe l a •

M.3 E l I i t p l i D l i - r u l d í J t 0> ' . : . i n L L # , [ . O p i ' l o talviriltr ' • t u l í - d * D l I C 1 M C 1 I 1 • 2 1 1 l i v a l l . 1 1 - 1 1 . 1 1 1 0 - 1 1 i

i a ű [A I p e r T c 1

i n j L• l í n u n j n : O p o r l o . " r j : i i L , • B l r l a t i t l c i . i n n i n l e l i n l l ' l c e i * 1 1 0 . í j ( a O p e r l e O n í v i n l l r ' . ^ . M x . 0« L l l l H i a ! •

ít0 |C i f l J t w i í » K.trH I r , S h . L. d * 1 í a e r l c . . . C l J o u r n a l n q . •

C O m i O L N O . ODI H í , 1 Z i S 2 i B 7 1 3 . 2 1 H ó

l o o r o r o F I L I • i w o i ' í i L i l i I K Ü c n i D - itttry*

• s a ; ] t i I m d i c c A t l 11 y a l . 1 - 1 * 1 5 -

• r i i u i J I r i i i t i J i i t - r i i i i i i

i - i . . : . U M i r a r a i t r I » ' i •• J i >1 l i l t m l l l l

' . I i t l l t f t o 0 1 l i m i t j e i

•fi/ín i h v i v f l d J I rn E i J o u r n a l i * a .

. ' . O / I J H

(3)

A feldolgozás módozatait meghatározzák;

• az input fizikai hordozója, jellemzői,

• az input minősége, m e n n y i s é g e ,

• a kivánt gépi output fizikai és logikai paraméterei.

• a megcélzott felhasználási m ó d ,

• az anyagi lehetőségek.

• egyéb szervezeti és irányítási feltételek.

A fenti szempontok alapján lehet választani akö­

zött, hogy számitógéppel segített kézi adatrögzítés vagy karakterbeolvasáson alapuló interaktív bevitel történjen.

A két lehetőség csak a feldolgozás első két fázisá­

ban, a "nyers"' adatok bevitelében és az adatalemek elhatárolásában különbözik egymástól. A hibaja­

vítás, az adatok kiegészítése m á r azonos módon zajlik. Nagy állományok (1—2 millió bibliográfiai tétel) esetén az első megoldás gyakorlatilag kivihe­

tetlen.

El kell dönteni azt is, hogy mágneslemezen (módosítható-kiegészíihetö formában) vagy végle­

gesen rögzítve, pl. CD-ROM-on fogjuk-e az adato­

kat tárolni. A nagy és lezárt könyvtári katalógusok számára az utóbbi megoldásnak számos előnye van

(pl. az egy tételre j u t ó alacsonyabb költség, a hor­

dozhatóság, nincs online igény). Még ha egy-három é v e n k é n t az új gyarapodás integrálása érdekében új CD-ROM-ot készít is a könyvtár és a legutóbbi idő­

szak gyarapodását m á g n e s l e m e z e n tartja, integrált rendszerrel egyszerre tudja kezelni a teljes állo­

mányt. (Itt ennek a részleteire nem térünk ki.) A m á g n e s l e m e z e s tárolás a háttéradatok jobb elérhető­

ségét nyújtja a feldolgozó rendszer számára, de ennek határt szab a lemezkapacitás.

Hazánkban a legnagyobb könyvtáraknak milliós állományuk van. a közepesnek 1 0 0 - 5 0 0 ezer egy­

ségük. Ennél kisebb állományok optikai lemezre vitele jelenleg még nem tűnik célszerűnek, söt a m á g n e s l e m e z e s tárolási technika bővülésével a kisebb könyvtárak igényei gond nélkül kielégíthe­

tők.

A kis és közepes könyvtárak számára a W O R M (Write Once Kcad Manyi lemezes megoldás is kí- n-ilkozik A távolabbi jovőben a törölhető j t v i t h i l o optikai lemez megjelenése e kérdések újragondolá­

sát teheti szükségessé.

Más megvilágításba helyezi a kérdést, ha valame­

lyik nagy könyvtár az IIF-hálózatba integrálva osz­

tott katalógus építését vállalja fel. Ez a kisebb könyvtárak számára a nagyobb gépi kapacitás hozzá­

férésének előnyével kecsegtet.

A katalóguscédulák gépi olvasását rendkívül megnehezíti a cédulák kopottsága, az eltérő írógé­

pek használata, színbeli eltérése, az Íráskép színe.

Ráadásul a rajtuk levő információk egyes elemei nem állandó sorrendben, esetleg felcserélve helyez­

kednek el; az egyes adatelemeket nem mindig ugyanaz a jel határolja el; szükség lehet az aláhúzás­

nak mint információnak a feldolgozására is; a karak­

terkészlet sokkal b ő v e b b (csak latin belük esetén is) a bővített ASCII-nél. Ugyanakkor megkönnyíti a beolvasási a betüközök és a b e t ű m é r e t viszonylagos állandósága.

A tétel logikai szerkezeiét a különböző címleírási szabványok és a belső könyvtári konvenciók hatá­

rozzák meg.

A Magvar Nemzeli Bibliográfia nyomtatott köte­

teinek gépi olvasását ugyan a sorkizárásos, kétha­

sábos szedés nehezíti, a tiszta íráskép és a jó papír viszont enyhíti a leolvasás nchézségcil. Ez a ha­

talmas, jól olvasható adatállomány biztos alapot szolgáltathatna a z ö m é b e n magyar anyagot gyűjtő könyvtárak gépi katalógusának előállításához.

Elképzelhető, hogy igény lenne gépi feldolgo­

zásra mikroformákból is, noha ezeken a könyvtári katalógusoknak csak kis hányada található. Az M T A Könyvtára esetleg mégis ezt a megoldást vá­

lasztja a mikrofilmlap-katalógus mechanikus kezelé­

sének egyszerűbb volta miatt, bár olvashatóságuk esetenként még rosszabb, mint a papírkártyáké.

Az outputtal szemben támasztott követelménye­

ink:

• a nyert C D - R O M . W O R M vagy mágneslemezes adatbázis leképezhető legyen az ismert szabvá­

nyos formákban (söt esetleg rendszerfüggetlcn f o r m á b a n ) ;

• legye lehelövé a kibővített ASCII vagy vele ekvi­

valens, cgybájtos. 256 jelen alapuló kód-, illetve karakterkészlet alkalmazását IBM PC X T / A T , azaz 16 bilcs feldolgozásra; vagy

• m á s , kibővített, nemzetközi szabványon alapuló karakterkészlet alkalmazását, s az itthon várható­

an installált könyvtári rendszerekhez legalább in- lerfés/cs illeszthetőségéi;

• legyen indexelhető legalább a szokásos eljárások szcrini (az utalásokat is b e l e é r t v e ) , de lehcioleg más has/nos szempont szcrini is.

A vázoli fejlesztés elképzelése ellen szól

• nagy bonyolultsága,

• a szűk hazai felvevőpiac,

• a külpiac szabványigényei, a lávvállalkozás ne­

hézségei,

• a fejlesztési erőforrások hiánya.

A fejlesztés melleiti érvek:

• a feladat aktualitása,

• a hardver- és szoftverfeltctelck nagyjából é r c n e k a sikeres megvalósításhoz (az OSZK és az

(4)

Teles A.: Optikai karakterohasn rendszerek..

M T A K várhatóan olyan számítógéphez j u t , amely a multitaszk ü z e m m ó d és a helyi hálózat révén alkalmas lesz a nagytömegű gépi adatbevi­

telre),

• a n ö v e k v ő bibliográfiai adatbázis növeli az újabb feldolgozás megbízhatóságát és hatékonyságát,

• a C D - R O M - o n és más adathordozón lévő kataló­

gusok már jelenleg is rendelkezésre állnak,

• a hagyományos katalógusok CD-ROM-ra vitele itthon esetleg a Videoton közreműködésével megvalósítható, de a nyugati bérnyomtaiásnak is jól kialakult útja van.

A fejlesztésben érdekelt lehet az OTKA-pályázat felhasználására alakult korlátolt felelősségű társaság ( M T A K . OSZK és S Z T A K I ) , továbbá a Videoton mint gyártó, valamint más potenciális felhasználók.

A fejlesztés m e l l é k t e r m é k e k é n t több, a d o k u m e n t á ­ cióban, a számítógépek irodai felhasználásában al­

kalmazható e r e d m é n y , termék is létrejöhet, ami a vállalkozás biztonságát növelheti.

Karakterfelismerő eljárások

A gépi képfeldolgozás, alakfelismerés és ezen belül a karakter (betű, szám) felismerése igen régóta foglalkoztatja a matematikusokat, m é r n ö k ö ­ ket. Ilyen tárgyú elméleti tanulmányok már a hatva­

nas évek elején is születtek [ 1 ] , és még ugyanebben az évtizedben az első kísérletek is lezajlottak 12],

A karakterfelismerés feladata elvben a követke­

zőképpen fogalmazható meg. Adva van a jelek egy .V halmaza, amelynek elemei egyértelműen az X osztályaiba vannak besorolva. Egy-egy osztály- elemei azonosíthatók egy karakterrel, illetve annak f o r m a v á l t o z a t a iV Ü I, amelyeket azonosnak "olva­

sunk". Keresendő egy olyan algoritmus, amely 1. egy ,Y-beli elemről eldönti, hogy melyik osztályba

tartozik,

2. felismeri, ha nem A'-bcli elemmel találkozik.

Az algoritmus értékelése az alábbi hibás döntések valószínűsége alapján történik

• .Y-bcli elutasítása, mint ismeretlen (ún. elsőfajú hiba).

• nem .V-beli .V-be sorolása,

• AT-beIi hibás osztályba sorolása, azaz A-\ lát, de B-\ olvas (ez utóbbi két eset ún. másodfajú hiba).

Világos, hogy elsőfajú hiba esetén lehetőség van a hiba javítására, ami persze lehet időigényes, igé­

nyelhet emberi beavatkozást, de nem rontja az output hűségét. A másodfajú hiba viszont csak el­

lenőrzéssel tárható fel, automatikus kezelése nem lehetséges. Ezért az algoritmus optimalizálása első­

sorban ennek a csökkentését és a lépésszám mérsé­

kelt növekedését kell. hogy egyensúlyban tartsa.

(Az irodalomban számos részben vagy elviekben más célfüggvényt is találunk.]

Az algoritmus, illetve a feladat kibővítésével három minőségileg igényesebb megközelítés is le­

hetséges.

• Az első egy adaptív algoritmust javasol: az algo­

ritmus nagyszámú minta olvasása után maga al­

kotja meg az X halmazt és annak osztályait, i l ­ letve a teljes munkafolyamai során lehetséges az

X, illetve az osztályok változtatása.

• A második eljárás lényege, hogy interaktív feldol­

gozást biztosit, azaz a felismerési algoritmus során (esetleg az adaptív eljárás egyes lépéseiben) emberi beavatkozást kér vagy tesz lehelövé.

• A harmadik a betűk teljes felismerése helyet!

szavak felismeréséi valósítja meg az alkotóelemek részleges ismeretében. Az eljárás tudatbázisra épít, amely nyelvészeti elveket és szótárat tartal­

maz. Ez utóbbi aulomatikus vagy interaktív módon bővíthető, az előbbi pedig esetleg nyelv­

től függően változtatható.

Ezeket az eljárásokat részben vagy egészben máris alkalmazzák m ű k ö d ő rendszerekben, de együttes alkalmazásukra eddig csak egyetlen példát ismerünk. (Lásd a konkrét rendszereket ismertető fejezetet.)

Az alakfelismerés! — így a karakterfelismerési — módszerek három nagy csoportba sorolhatók:

• összehasonlító,

• statisztikus.

• struklurális módszerek.

A gyakorlati algoritmusok ezek kombinációját is alkalmazzák, de valamelyik eljárás dominál.

Az összehasonlító módszer a nyers vagy előfeldol­

gozott karakter és a tárolt "etalonok" összehasonlí­

tásán alapszik. (Ilyen pl. a postai irányítószám olva­

sási eljárása.)

A statisziiktts módszer kél fázisból áll. A "ta­

n í t á s " során a tömörített alakjellcmzöket leíró kód készül valamennyijeiről. A felismerés során a jelek kódja közt definiált valamilyen távolságfüggvcnyt felhasználva lehel a jelei a legkedvezőbb osztályba sorolni. A tömöríteit alakjellemzö kód létrehozására ma az ún. gyors Kourier-iranszformáctói használják a legszívesebben.

A struklurális módszer egyrészi felhasználja a jel­

készlet a priori jellegzetességeit, másrészt az elöfcl- dolgozás és az esetleges szegmentálás (azaz rész­

alakzatokra bontás) után az (clemil alakzatot topo­

lógiai jellegzetességeivel írja le. Ilyen a bejárási útvo­

nal kódja, a relatív hely/el kódja slb. Ezek a kódok az eddigi eljárásokkal ellenlétben nem egyszerűen jelsorozatokat reprezentálnak, hanem a jelkészlet jellegzetességének megfelelő nyelvtani szabályok­

nak is elegei lesznek. A felismerés során az alakza-

(5)

T M T 35. évf. 1988. 10. s í .

(ol leíró mondai nyelvtani e l e m z é s e vezei el az osz- lályba soroláshoz, vagyis az azonosításhoz. Ez a megközelítés az alakleíró, illetve a formális nyelvek e l m é l e t é r e épít; ezek szabályait, szintaxisát többek közt Chomsky vizsgálta [31.

Napjainkban a gyakorlatban alkalmazott eljárások vagy az etalonnal való Összehasonlítást valósítják meg a viszonylag nagy tárolt jelkészletre építve, vagy a strukturális módszeren alapulnak. Ezek ese­

tenként ad hoc egyszerűsítő megoldásokat alkalmaz­

nak és a végső osztályba sorolásnál valamilyen sta¬

tisztikus eljárásra kerül sor.

Karakterolvasó berendezések

Az első valódi karakterolvasást végző berende­

zést 1912-ben Gotdberg szabadalmaztatta; ez a ké­

szülék távírókóddá konvertálta az elolvasott jeleket.

Az első ismert, valóban m ű k ö d ő optikai karakterol­

vasó (1914) Foarier d'Aibc nevéhez fűződik. Készü­

lékét vakoknak tervezte, melynek segítségével a kézzel vezérelt olvasófej " é r t h e t ő hangol" generált.

Az első m u n k á r a fogott készülék 1954-ben szüle­

lett az IntelÜgenl Machine Corporationnél a "Rea- der's Digesl" számára; ez írógéppel ín szövegel tudott olvasni. E cég készített 1959-ben az USA lé­

giereje részérc karakterolvasói, amely képes volt kis- és nagybetűs alfanumerikus jelkészletet elol­

vasni. A szakirodalom 1960-ban a Szovjetunióban számol be ilyen eszközökről. Ezek és a következő időszakban szüleiéit berendezések két csoportba so­

rolhatók: fényképészeti maszkkal tárolt, illetve elektromos (ellenállás-mátrix stb.) etalonok. Ezek a berendezések már a hatvanas évek elején is képe­

sek vollak 1000—2600 b e t ü / s sebességű feldolgo­

zásra. Később a technikai fejlődéshez képest lassan nőtt a karakterolvasók teljesítménye.

Az elmúlt harminc évben a feladatspecifikus be­

rendezésekel lassan felváltották az általánosabb, sok célra felhasználható készülékek. Megszűnt a technikai megoldások széles skálája, kialakult egy viszonylag általános eljárás, amely a beolvasandó in­

formáció fizikai fogadásához analóg-digitális átalakí­

tót alkalmaz és löle elkülönítve a digitális jelek értel­

mezésére szolgáló számítógépei, illetve célberende­

zést. Az olvasóegységek legfontosabb fajtái;

• iv-kamera bemenete,

• CCD töltéscsatolt k é p b o n t ó .

• lézeres letapogatással m ű k ö d ő berendezés.

A jelentős változást a töltéscsatolt berendezések (CCD) megjelenése hozta a hetvenes évek elején.

Ezek napjainkra a felbontás jelentős mérvű növelé­

sét tették lehetővé, igy az input információ sokkal alaposabb e l e m z é s é r e adnak m ó d o t . Csökkent az irásképpel és a papírminőséggel szemben lámasztoit k ö v e t e l m é n y , gyorsult és finomabbá vált az infor­

mációfeldolgozás. Napjainkban szabványként emle­

getik a 300 poni/inch (kb. 120 pont/cm) felbontási, de természetesen ennél jóval nagyobb felboniású készülékek is találhatók a piacon. (Egy A4-es oldal­

ról 1 Mbájt információegységet olvasnak le a szo­

kásos készülékek, tehát kb. egymillió betűnek meg­

felelő információ szükséges egy A4-es oldalon lévő kb. 1800 jel megbízható azonosításához.)

Az alábbiakban a teljesség igénye nélkül ismertet­

jük az 1980 után forgalomba került néhány beren­

dezés nevét és gyártóját, valamint főbb paramétereit [4]. (Általában a többféle betűtípust feldolgozni képes készülékek esetében is szabványos jelkészle­

tekről, pl. a leggyakoribb írógépek betűtípusairól — Courier 10, 12 vagy Prestige Elité 12, Pica stb. - van szó.)

Alphaword3 + (1985 e l ő t t ) . Formscan Compuscan.

120 jel/s, azaz 145 lap/óra, online javítás, 300 000 jelenként egy hiba. tízféle (szabványos) jelkészlettel bővíthető, de alapul egy jelkészlet szolgál. Ára: 22 850 font.

Series 80 A . B. C (1985 e l ő t t ) . Formscan. 145 lap/óra, 1, max. 3 belütipus. Ára: 11 500 font.

Dest Worklcss Slation Modcl 21 1, 212, 213, 222, 223 (1982), Lexisystem. Képes sorkizárt szöveg olvasására, jobbra és balra zárt bekezdések értel­

mezésére, max. 12 belütipus olvasására automa­

tikus beiütípus-kiválasztással. Többféle betűtí­

pust is olvas egy lapon belül. 145 lap/óra. Nincs saját billentyűzete. Ára: 8 0 0 0 - 11 500 font.

Omni-Reader (1985. j a n . ) , Oberon Inlernaiional's.

25 b e t ű / p e r c , kézi mozgatású olvasófej, négy jel­

készlet. Sajátos tagja az O C R - t e c h n i k á n a k , olcsó, egyszerű, mégis számos igényt kielégít. Ára; 500 USD.

Palantir Compound Document Processor (1986), Palaniir Corp. Etaionos összeállítás, 0,25 — 2 ol­

dal/perc a betűkészlettől függően. Ára: 40 000 USD.

OCR 6001, Sepsi (francia cég). 9 nyomtatott be­

tűtípus, min. 7,5x12,5 cm, max. 21,5x35,5 cm.

Lapméret; 250 lap/óra.

A továbbiakban bemulatott olvasókészülékek az ún. ICR- (Inielligent Character Reader) családhoz tartoznak. Közös jellegzetességük a tanilhatóság, i l ­ letve az automatikus adaptivitás, a nagy háttérinfor­

máción alapuló intelligencia. Tulajdonképpen olva­

sásra, érzékelésre kialakított mesterséges intelligen­

ciát képviselnek. Ennek a családnak az első és talán leghíresebb tagja a Raymond Kurzweil által kifejlesz­

teti

(6)

Teles A . : Optikai karaktéról vasó rendszerek..

K u r / w c i l 4000 (1983). Kurzweit Computer Products, Cambridge Mass (USA,. Struklurális. topológiai eljárással képes é r i n t k e / ö karakierek szétválasz­

tására, illetve hiányos vonalú karakterek felisme­

résére, szerkesztési forma visszaadására. Ára:

34 500 USD.

K D F M 1100, K D E M 1200. Compaci Computer G m b H ( N S Z K ) . Tanítható, 250 000. illetve

160 000 jel/óra. 6500 D E M havi bérleti díj.

Meg kell különböztetni az olvasókészülékeket és a karakter felismeréséhez szükséges programokat.

Egyre szélesebb körben terjednek el az ún. "dcsk- top", azaz asztali olvasókészülékek, amelyek mini­

vagy mikroszámítógéphez csatlakoztathatók aszink­

ron kimenettel. Bár a gyártók természetesen karak­

terfelismerő programot is kínálnak hozzájuk, lehe­

tőség van más programok alkalmazására is a szabvá­

nyos csatlakozással. Ilyen készüléket majd vala­

mennyi hardvergyártó kínál az IBM-től kezdve az AGFA-ig. Töltéscsatolt kamerát a Híradástechnika Szövetkezel is gyárt, amely ugyan nem irodai alkal­

mazásra való, de felbontási és egyéb paraméterei alapján alkalmas karakterolvasásra.

Az 1987-es őszi BNV-n mutatták be az SZKI nemzetközi érdeklődést is kiváltó RECOGNITA ka­

rakterfelismerő programját. Az algoritmus struktu­

rális módszert használ, és képes új karakterek meg­

tanulására is. A rendszer irodai célokra készült, ezért a benne felhalmozott jelentős intelligencia el­

lenére lömegléldolgozásra, gyengén olvasható input fogadására nem célszerű felhasználni.

A katalógusok visszamenőleges beviteléhez szükséges berendezések ma elérhető áron beszerez­

hetők, a feldolgozáshoz szükséges algoritmusok, i l ­ letve programok megvannak, megvásárolhatók, i l ­ letve kifejleszthetők.

A nyugati informatikai piacon megjelentek azok a vállalkozók, akik olvasóberendezés és számítógép birtokában széles skálán vállalnak feldolgozást, minden elképzelhető kapcsolódó szolgáltatással együtt.

Hagyományos katalógusból géppel olvasható katalógus

A hagyományos katalógusnak géppel olvasható katalógussá való átépítéséi nagyban segíti, ha vala­

hol már hozzáférhető valamilyen, az átépítést ter­

vező könyvtár állományát legalább részben lefedő gépi katalógus. Ennek online vagy offltne felhaszná­

lása jelentősen megkönnyíti a feladatot. Igénybevé­

telénél esetleg az okozhat nehézséget, hogy a fogadó fél házi szabványa eltér a felhasznált adatbá­

zisétól. Ezek a nehézségek nem mindig hidalhatok át az átvételkor.

A tapasztalatok szerint a kézi bevitel igen sok hiba forrása, ami a gépi visszakeresési lehetetlenné leszi; ugyanakkor adatok bizonyítják, hogy a gépi ol­

vasás lényegesen olcsóbb, mint az emberi munka [5],

A O P T I R A M / l . I B P A C K rendszer

flarrisot} cikkében [6] egy igen fejlett OCR-, il­

letve ICR-technológiára épülő, retrospektív kataló­

gusfeldolgozó rendszert ismertet. Az O P T I R A M / LIBPACK rendszer hardverkonfigurációja a követ­

kező elemekből áll:

• C A N O N F A X 3 2 0 E ( G r o u p 3 ) .

• M C VESCA számítógép I Mbájt memóriával,

• 80 Mbájtos winchester-lemezes tároló,

• ellenőrző terminálok,

• Dala Scope (a feldolgozott információ ellenőrzé­

s é r e ) .

• PERTEC, 9 csatornás mágnesszalagegység (800 és 1600 bpi-s inicrfésszel).

A beolvasást egy közismert lelefakszimilc beren­

dezés végzi, a nyers információi pedig egy nagy bo­

nyolultságú intelligens program bontja egyedi karak­

terekké. F.lsö lépésként a mágneslemezen található mintákkal hasonlítja össze a jeleket és ASCII kódol generál belőle. A továbbiakban egy, a karakterfelis­

merési eljárásokról szóló fejezetben ismertetettektől drasztikusan különböző módszer! alkalmaznak.

A szóképolvasás

Az elöfeldolgozás ulán minden egyes szól meg­

vizsgál a rendszer, hogy szerepel-e a szótárában; ha igen, azonnal outpuira kerül. Ha nem, akkor a nyers inputot behatóan újra elemzi. Ezulán a szót végül is vagy megtalálja a szótárban, vagy elfogadja annak ellenére, hogy a szótár nem ismeri, mert a benne szereplő jelek pontosan felismerhetők, vagy pedig nem fogadja c l , mert a jelek nem ismerhetők fél. Egy új szó akkor kerülhet be a szótárba, ha

• minden karaktere nehézség nélkül felismerhető, vagy

• a benne szereplő hangzók egymásutánja eleget lesz a nyelv ezekre vonatkozó általános szabályai­

nak.

A szótárat a felhasználó kívánsága szerint bővít­

heti. A rendszer kiterjedt hibajavító eljárásokat tar­

talmaz. A nem elfogadott szavak is outputra kerül­

nek, de ezekéi a rendszer kívánság szerint megjelöli.

Az OPTIRAM leolvasó képes kézzel írt alfanu­

merikus szöveg feldolgozására. A feladat bonyolult-

(7)

T M T 3 5 . c v f . 1988. 10. S Í .

sága lassítja a feldolgozást, de amint az 1. és 2. ábra mulatja, az e r e d m é n y rendkívül jó. A kézírás felis­

m e r é s e vegyes, strukturális és etaionos módszeren alapszik. Nehéz esetekben a statisztikus döntési el­

járás "legjobb tipp"-jét helyettesíti be a rendszer, amelyet azután a szótári ellenőrzés hagy helyben.

Speciális eljárások gondoskodnak

• a megszakadt vonalak kitöltéséről;

• a papírhibák, foltok, összemosódások zavaró há­

lásának kiküszöböléséről;

• az áttetsző papír, a színes nyomás, a szakadások, eltűnt jelek okozta nehézségek leküzdéséről.

A rendszer nagy ereje tanulási képességében rejlik, amely a korábbi tapasztalatok felhasználásával növeli a felismerés sebességét, biztonságát.

A jelkészletre semmilyen korlátozás nincs 161. a rendszer minden latin betű, minden európai nyelv ékezetei és diakritikus jelei, minden szokásos speci­

ális karakter, az alsó és felső index, a matematikai jelek, a görögjelek feldolgozására képes. Tervezik a

cirill betűk é s a héber jelek bevonását is.

A rendszer U K M A R C és L C M A R C feldolgozá­

sára é s előállítására alkalmas, de szó van az ISO- karaklerszabvány minden lényeges elemének átvé­

teléről is. A nem szabványos jelek transzliterálását a felhasználó szabhatja meg.

A LÍBPACK formaelemző a szöveg kezelése mel­

lett lehetővé teszi a kártyakép feldolgozását, pozi­

cionálását, azaz az egyes adatelemek funkcionális el­

határolását, felismeréséi és kapcsolataik rögzítéséi is. Képes követni a katalóguskártya formaváltozatait akár k ü l ö n b ö z ő könyvtárak katalógusairól, akár egy könyvtár katalógusán belüli változatokról van szó.

A felhasználó kívánsága szerint el lehel hagyni bizo­

nyos adatelemeket, felcserélni mások sorrendjét a rekordban.

Harrison szerint a katalóguskonverziónál az alábbi tényezőket kell figyelembe venni:

• költségek,

• a programok irányítása,

• hozzáértő szakembergárda megléte, illetve alkal­

mazása,

• a minőség ellenőrzése,

• megfelelő szabványok.

1985-ben e, rendszer segítségével a gépre való át­

vitel katalóguscédulánkén! a bonyolultságtól függő­

en 30 penny körül mozgott, mig a hagyományos m ó d o n az USA-ban 1,55-3 dollár, Angliában 1 - 5 font volt az átlag.

Harrison példáit az 1 —6. ábrákon közöljük. Ezek a rendszer hallatlan erejét bizonyítják. Az 1. ábra három katalóguscédula másolata, a 2. az ezekről

INK H»S HOT BULI ! E E H U S E F U L I N I l L l ü t S , S U T S T I L t C O M T I B U E S

• S S O L U T E I T H E C E S S W Y 1 0 T H E P f l E 5 £ « Y » t ION A B D IAPP.OVEMENT O F i . • r ' É r t l o d l a l a i v a , <Bd f o r

t r u l IC T l ° n • o í I l i * .

s d t f c t l D i 1 4 * p r d l n a i r

0*11* r i p f l r t e n c r . í h u r l . T r . i l I h í m o l l corwf O D J u l s . o m f r n l l y p r o v t m ű i t U 4* ' u l i n d b r i r V L c i » l 10 « n l 1 n d . Thf í o n i t l n t K C H l a n *t n i r t f o r ínk, f l - ' . r s I I I t o n t e n l í f l í f i n d u l l l l l y . I V w f Ihu t n p a r í a i t t m / U l áriáiig to aociily / r ö n itt tfd, tnd I * * fo/üKfl i ii i " if i i f l ! • miy HdffAP / .- - thi frsvát of d*tir,i*g tSt QPuri of thít H t t f a H a r f orlielt. it i « co 0< uitStd ttet t\4 l - a í f l l a t u r * i » l i l d frer*

i<r* r í p x l ű í í ű i t o pnrvt* itt Í T r c t f í * * 11. ű"d" p r* v r i t Vnavny W d w j K c * fKn it I n l t r u o i E n t d l t o C h t s e c o r a p1 1 1r i r o o n t • o l i r

• a a e p u c p o B * .

\}-U$M c ^ \ A tÁe^- H

készült M A R C rekord. A 3. ábrán k ü l ö n b ö z ő be­

tűtípusok és kézirás látható, a 4, ábrán ezek gépi ol­

vasata, a megfelelő tipográfiai adatokkal. Az 5. ábra könyvbeli szöveg, a 6. ábra ennek olvasata.

É r d e m e s megfigyelni, hogy a szedett szöveg sorki­

zárásos, többféle címet és bekezdésmódot tartal­

maz, amelyeket a rendszer szintén visszaad. Az output szövegben > . . < jelek közt található a tipog­

ráfiai utasítás. Ezek a következők lehetnek:

as: kisbetű fc: betűtipusváltás h l : cím

h2: cím (antikva, középre) it: kurzív

10: bekezdés folytatása 11: bekezdés kezdete gc: bekezdés középre zárva ql: bekezdés balra zárva ro: antikva

t l : szöveg kezdődik (cím után) xs: kisbelű vége

Az elválasztott szavak jelölésére (ez katalóguscé­

dulán nem fordulhat elő) a + jel használatos.

(8)

Teles A . : Optikai karaktéról vas 6 rendszerek...

i h lii H l S i q | j

l l l M t l c l N O t a l H P S N O T D H L T B É E H U S E F U L [ N Í * _ L A G E S , B U T S T I L L C ü N T I N L C S flíJSŰLUrfLr N e C £ S 5 W . ¥ T D T r C P R E S f T R U f l T I R H D | J f > f t * C K H f O F> N* ( í q t <

> 1 0 ( ] t c i í v * r v * r t * n d i c l i n c t , * n d f a r C D f l d k l c t l n g t h » o r - d i m r y l r i n n C t i O. i t O f Lí r *. i q l l

Í 1 1 ( tlc c D * L l y " • p i ' i m t t i h i - i . t h a i t h * m a i l commci-. c b j t c l i . c i n i n l t y p r u v f m a t l u u ' u L i n d h a n t i Íj c l t i l a m i n * I n d . T h t r c o m t a n L o c c a t l a n w * h a v r

for I n l t , a v i n c r i I t t t a r v v a n l a n c a m d u t U l t y , 111 ( > f c . F r o n t h * f m p o r l i n t h i m f i i i t r l i i n g t a i c c l t t y f rom I I * u n . a n d t h t i n l u r l a * J n d l w l d u a I • may

luftot í r o m t h * í r # u d i o f d a i l g i M n g i m n I n t h r a b u i a a f Í M * n a c t t l - t r y

• r t l d t i i t l l l O b r w l i h i í t h i l ( h t 1 t g l l l * t u r a w u u t d f r m v I O I K I r t g u l a t i a n <o o r o n- o t a 111 L a i p r o v t i n a n | , a n d p r a v a n l k n a v t r y i n d t v i r J c i í r nm ö n k i i i g t t i F o í J f c t i n t t r u f f * -1 i l 1D t h * a c c e m p l i i h t r v a n t I a f a n y h i t t

p u r p o n . ) q t |

i M Í > t i í S L r n a l j / 41 . [ h » c ü m p j i l t i o n a f L n k m i y b e t h a u g h l , i n d n • I I y 11, H L i * w p i i k n e ^ - f j t c t j t h « t « t h a w t i t p r t t . t r. 1 n o n * a q u » l I n b a a u t y a n d c o l o ^ r t o I h a t u i a d b y t h a a n c l r n t • . i q l i

U l f T i k t r . í r o f n " T n a G a l t a r y o f M a t ú r a i n d ö r f b y t n a R t - , E d w a r d P o I p n a. T^ t u n , 1 S 1 S > q< |

4. ábra

2 8

B u c i OR G A H D E N N I G B T S I . A D E , Scítmani nigrum, P L I T E X I V ,

haa proved falai in serpral cascs. ita c-fT^ct Ü being more poweríul tbrin tbcsc produced by the Bitter-a*eet, thougb aimilar in nature. T b c plánt ia SDDU&I. riaing ta tbc beigbt of oae or two feet. and beaxiog imall white flowera reaembliog those nf tbe la=t mention ed i n form, The bemes. prhen maliire, arc black. It ia a coramon weed in gardena. by waysidei. and about manure heapa. Liké tbe Woody Night-

•had«. it h u n Mim?times been í m p l o y e d in medicine.

H E Í Í H A N E , iíjfűicjamuj n i j f r . P L Í T K XV.

An BDDiiaJ plaat. not uncornTnon in í o m e párta of tbe country iu waate groixod D Í Í T towns and TÜlagpa, geoeríJ]y in dry placea or about rubbisb beaps. It growa írom a few íocbfa to a foot or more in heighl. with dovmy atems and líaepa. baring a atroogly fo^tid odoor, Tbe flnwen art grceoiab-ydlow, generally, with dark veina forrni cg a network (jvcy the corolla, but aometimea of a patc yellow aod witbout T e i n s j tliej arc produced iu July and Auguit. T h t wbole berb ia poiaonoo.9 to man, tbnugb apparently haviug IjtMe elTect 0 0 domestic c&Ule and baraea. It occuiona delírium aod atupor, accompamed b y g r t a t dilalatiou nf tbe pupil of tbe eye. Tbe seeda bave been uaed for amoleing, aa a reroedy for tocihache. but abould n e v e i be employed, having caused coovulaioaa, ami even inunity, in lomé iDsUaceii The leavea arc tbe moit powerful portion of tbe p l á n t ; even tbe odour of tbeae, wben frteh, will produce giddinesa and atupor.

Two fat&l cava at leaat of poiaoning by thia plánt ate re-

(9)

T M T J S . é v f . 1988. 10. s*.

] h 2 c B > a * i L f l C K O B 1 . . 1 O u j i C H D e N i . n N i n i I G H I S H R O E . > « « i I i 1 < S a l i n u m n i g r u m . > r o < P m < L C j T E > n * c X I U . l q r <

> 1 I ; > • 1 < h . . - . p r a v * d f a t á l í n * a v * r a t I M I I , I I I p f f p c t s b * l n g m o r f p a t r a r f k i l r h- . i r p r o d u c a a T b y t h * D l t t* r t* w * t t , t h a u g h l l a l l v r i n n a t ú r t , T h a

p l á n t i * a n n u a l . r i t i n g t o t h a h a i g h t o f o n a o r t w o í a r t . a n d b t i r i n g i m a l l v h i t a f t o v p r i I h o a a a f t h p I n t m a n t i o n p d i n form. T h a b a r r i a a ,

- ' r • m a t ú r a , a r a b l a c k - M i * a c o i r t n o n v a a d I n g a r d á n * , b y a n d

a b o u t f n a n u r * h p a p * . L i k a t h * w ű o d y N l g h t i h a d * . i t h a * l o m a t i r n a * b * * n r n p l o y c d i n j n a d l r i n * , t q l t

) h 2 ( H > a * < E N B O N £ . I H I 1 i t ( H y o n r y a m u i n l g t r . l r o l P ) a u L O T E I M I t X U . I q c l

> M í > t 1 í i M í P n a n n u a l p l á n t , n o t w n c o a i w n i n l o i a p á r t a o f t h a c o u h t r y i n v a l t a g r o u n d n a a r ( a n d v i l i i g * * , g v n t r a l t y i n d r y p i a c a * o r a b o u t r u b b l s h h * a p * . ti g r o w * f r o m a f a t r i n c h * * t o 1 f o n t or m ó r * í n h r í g h t , w i t h

d a v n y * t * m * a n d l a t v a i , h i v i n g a í t r o n g l y f ) * 1 < t i d o d o u r . T h * f l o w t r * i n g r t a n í i h t y r l L u v , g a n a r i L l y , w i ' . h d a r k « r i n i f a r m i n g a n a l w o r k o v p r t h *

c o r o l l a , b u t * o m * t l r n* K a f a p a l p y a l L n w a n d w l t h o u t v * i n * j t h a y a r a p r o d u c a d í n J u l y a n d Q u g u i t . T h * w h o t t h * r b it p o i s o n o u * t o m i n , t h c u g h a p p a r a n t l y h a v l n g l i t l l * * f f a c t o n d o m a t t i c c a t t l a a n d h a r i p * . I t o c c a t í o n * d a l i r i u m a n d i t u p o r , a c c o m p a n i a r i b y g r a a t d í l a t a t i o n o f t h a p u p l l o f t h a

* y * > . T h * * p a d * h a v a b a a n u s p d f o r i m o k i n g , a l > r e m t d y f o r t n o t h a c h * , b u t i h o u l d n p v p r b r p m p l o y p d , h a v i n g c a u * * d c o n v u l * í o n *H a n d a v a n i n a a n l t y , í n t o r n a i n * t # n c * t . T h * t p a v * * a r * t h * r n n i t p o v e r f u l p n r t i n n o f I h a p l i n t j p v * n t h a o d o u r o f t h r t t , w h r n f r r i h , v i l i p r o d u r * g i d d i n * * * a n d i t u p o r . T v o f j t t a l m a * a t l a a t t o f p o i i o n i n g b y t h i * p l i n t a r c r * * > q j (

f>. á/llll

A katalógusok visszamenőleges konverziója C D - R O M segítségével

Az első C D - R O M kiadványok közi jelent meg a Lihrary of Congress (LC) angol, idegen nyelvű és Any-book (szerzeményezési) katalógusa a Library Systems and Services és ettől függetlenül a Library Corporation gondozásában. Már a kettős kiadás is nagy piaci sikert sejtet. Azóta további C D - R O M kiadók is megjelentek az LC katalógusának valami­

lyen formájával. A C D - R O M könyvtári alkalmazása eddig két területen kezd komoly méreteket ölteni [7]. Az egyik a katalógusok retrospektív konverzi­

ója, a másik a s z e r z e m é n y e z é s . Az utóbbi a kiadói listákat tartalmazó CD-ROM-okra, az előbbi pedig valamely könyvtár katalógusát tartalmazó C D - ROM-okra támaszkodik. Mindkét területen számos intelligens szoftvermegoldás könnyíti a könyvtárak munkáját, egyes CD-ROM-ok online hozzáféréssel, illetve online rendelési lehetőséggel vannak kiegé­

szítve. (E helyütt nem térünk ki a szerzeményezést segítő C D - R O M t e r m é k e k r e . )

A visszamenőleges katalógusépitést C D - R O M szolgáltatásra alapozó vevő bízvást számíthat arra.

hogy a kezelőprogram segítségével a házi szabvány szerinti formában kapja meg a bibliográfiai rekordo­

kat, s k é n y e l m e s szövegszerkesztő program segiti a rekordban esetleg szükséges módosítások végrehaj­

tását, a CD-ROM-on nem található tételek kézi be­

vitelét. Az alkalmazott rendszerek könnyen átte­

k i n t h e t ő , egyszerű, funkciói között m e n ü r e n d s z e r segítségével navigálhatunk. A bibliográfiai tételek sok közvetlen elérési ponton keresztül visszakeres­

hetők az adatbázisban. A keresést logikai operátorok és csonkitási lehetőség könnyíti. A rendszer segítsé­

gével katalóguscédula é s címke n y o m t a t h a t ó . Felis­

merve a CD-ROM állandósága és a katalógus bővü­

lése közti ellentmondást, egyes kezelőprogramok úgy vannak kialakítva, hogy a winchesteren és a C D - R O M - o n tárolt rekordok közt úgy keres, mintha egyetlen adatbázist alkotnának. 1987-ben a következő rendszerek álltak rendelkezésre:

Bibliofilé. Library Corporation. Az első ilyen típusú termék, amelyet napjainkig a legtöbb, ezernél több példányban adtak el. Az adatbázis 2.2 millió

(10)

Teles A.: Optikai karaktérólvasn rendszerek..

angol nyelvű rekordot tartalmaz négy lemezen, egy továbbin pedig egymillió idegen nyelvű rekordot. A bővíteti szolgáltatású rendszer a következőket kí­

nálja: max. nyolc munkahely helyi hálózatba kapcso­

lása és egy közös adatbázishoz való kapcsolódás; vo­

nalkódolvasó; 340 Mbájtnyi (láncba köthető) winchester-lemez a helyi adatbázis tárolására. A rendszer egyetlen gyöngéje, hogy nagykönyvtárak számára nem igazán magas a találatok száma, azaz a fogadó könyvtár katalógusa és a C D - R O M állomány közös tételeinek száma nem teszi ki az állomány túl­

n y o m ó többségét. Ezért szükséges más gépi kataló­

gusforrások bevonása is.

LaserQaesl, General Research Corporation. 1986 júliusában jelent meg, jelenleg 100-nál több instal­

lált példánya van. Az állomány 4,5 millió rekordot (2,2 LC, 2,3 kiegészítés) tartalmaz három lemezen;

a negyedik lemez 260 ezer kanadai könyv C A N - M A R K adatait tartalmazza.

Spectrum 400, 800, 1000, Library Systems & Ser­

vices Inc. A Laserfile 2,2 millió rekordjára épül, s várhatóan a N I C E M adatbázis adataival is bővül.

Igen drága rendszer, viszont a személyi számítógé­

pektől kiépílhetö egészen a sok munkahelyes M I C - R O V A X rendszerig.

CD-CATALOG-OCLC. Az OCLC 1981-től fel­

vett 1.4 millió tételét, továbbá az LC 1,8 millió téte­

lét tartalmazza. Az OCLC tagkönyvtárai számára készül.

D/SCON-UTLAS.-DISCON. Az UTLAS tagjai számára készült katalogizálási segédeszköz. Az

TELCS András: Optikaikarakterolvasó rendszerek könyvtári alkalmazása

Az o p t i k a i k a r a k t e r o l v a s ó b e r e n d e z é s e k é s algo­

r i t m u s o k f e j l ő d é s e a k t u á l i s s á t e s z i a k ö n y v t á r i a d a t ­ b e v i t e l a u t o m a t i z á l á s á t . A t a n u l m á n y ennek a fel­

a d a t n a k a f ő b b f e l t é t e l e i t i g y e k s z i k á t t e k i n t e n i , be­

m u t a t v a a n e m z e t k ö z i s z a k i r o d a l o m b a n t a l á l h a t ó e r e d m é n y e k e t .

* * *

TEJIH, A.: npMMCHCHHC OÜTIWCCKHX 'IHT3IOIUHX yCTpOHCTB B ŐHŐJlHOTeKaX

B B C ^ C H I I C H p a - J B í i T i i e o n T H 4 e c K M X H H T a t o m n x VC'TpOÍÍCTB H 3J1 TOpHTMOB C03flaj]H a K T V a J l b H O C T h U B T O M U T i n a U H H BBOfla n a H H b i x I I ÖHÖJlHOTeKaX,

A B T O P nbiTaercfl p a c c M O T p e T i > ocHOBHbie ycno-

BHfl 3 T o r o 3aflaHH5i H n p o f l e M O H C T p u p o B a T b p e - - j y j i b T a T h i . njJto>KCHHh]e B H a y i H O - T e x H H M e c K o í í

jiHTepaType.

összes 1984 előtti LC rekordot és a R E M A R C adat­

bázist tartalmazza. A négy lemez és a terminál havi bérleti díja 800 USD. Az automatikus feldolgozást sokkal megbízhatóbbá teheti e háttérkatalógusok al­

kalmazása. Ezzel az olvasást a szótári összehasonlí­

táshoz hasonló támogatással lehet ellátni, azaz e cél­

feladat esetén betű-, szó- és kártyaképolvasásról együtt lehet beszélni. A feldolgozás megfelelő fázi­

sában néhány azonosított szó (név) alapján keres­

hetjük a háttérkatalógus azonos tételét; megtalálása, ill. pontos azonosítása után a további olvasást mel­

lőzve á t e m e l h e t ő a tétel készülő katalógusunkba.

Irodalom

III F A N S T E I N , A.: Osnovi leonj informacij. Moskva. 1960.

[21 K O V A L E S K I J . V. A . - S L E Z 1 N G E R , M. Y . - R I B A K . V. ].: CitaűSie avtomati i ras pózna van ie obrazov, Naukava l í u m k a . Kiev. 1965.

[31 H O P C R O F T . J. E . - U L L M A N . J . D.: Formai languages and ihcir rclalion to automata. Mussachusells. 1969.

|4| S C H A N T Z . II. I7.: O C R dala entry systems: curreni and future uses. = The Office. 91. kői 2. sz. 1980. p. 58. 60.

63. 65.

[51 M O R T E N . II.: Oplical scanning for reirospeciive conver- sion of informaiion. = The Electronic Library. 4. köt. 6.

sz. 1986. p. 3 2 8 - 3 3 1 .

[6] H A R R I S O N , M.: Reirospeciive conversion ofeard catalo- gues inlo full M A R C formai using sophisticaied computer-eonirolled visual imaging lechniques. = Pro­

gram, 19. köt. 3.sz. 1985 p. 2 1 3 - 2 3 0 .

[71 J O N E S . R.: Compact disc technology; Developmenis and Standards. = Dala Processing. 28. köt 6. sz. 1986. p.

295-298.

TELCS, A.: Library applications of Oplical Character Recognition (OCR) technology

The development results ofoptical scanners and character recognition algorithms made the automa- tion of library data recording by OCR systems feasi- ble. The state-of-the-art and main trends of the ap¬

plication of OCR technology in libraries are over- viewed, based on the imernational literature.

TELCS, A.: Die Anwendung der optischen Zeichenleser-Sysfeme in den Bíhlioiheken

Die Entwicklung der optischen Zeíchenleser- Systeme und Algorithmcn macht die Automatisie- rung der Datcneingabe in den Bibliotheken aktucll.

Die Studie bestrebt die wichtigsten Bedingungen dicsér Aufgabe z u überblicken, in dem sie die Er- gebnisse in der internationalen Fachliteratur darstellt.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

(Véleményem szerint egy hosszú testű, kosfejű lovat nem ábrázolnak rövid testűnek és homorú orrúnak pusztán egy uralkodói stílusváltás miatt, vagyis valóban

tanévben az általános iskolai tanulók száma 741,5 ezer fő, az érintett korosztály fogyásából adódóan 3800 fővel kevesebb, mint egy évvel korábban.. Az

Legyen szabad reménylenünk (Waldapfel bizonyára velem tart), hogy ez a felfogás meg fog változni, De nagyon szükségesnek tar- tanám ehhez, hogy az Altalános Utasítások, melyhez

Az akciókutatás korai időszakában megindult társadalmi tanuláshoz képest a szervezeti tanulás lényege, hogy a szervezet tagjainak olyan társas tanulása zajlik, ami nem

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A „bárhol bármikor” munkavégzésben kulcsfontosságú lehet, hogy a szervezet hogyan kezeli tudását, miként zajlik a kollé- gák közötti tudásmegosztás és a

A kérdés az, hogy ezek a fels oktatási intézmények mennyiben min sül- nek még iskoláknak, a szó klasszikus értelmében, vagy inkább piacorientált vállalkozásnak.. És