O P T I K A I KARAKTEROLVASÓ R E N D S Z E R E K KÖNYVTÁRI A L K A L M A Z Á S A
Teles A ndrás
VITA Ki:m \ tára
A könyviári számítógépes rendszerek kialakításá
nak eddigi akadályai közül egy elhárulni látszik:
kisebb-nagyobb számítógepek jutnak mind több könyvtárunk birtokába. A helyi szellemi erők és az anyagi háttér kérdése most már az, hogy milyen programok lógják az egyes könyviári munkafolya
matokai megkönnyíteni. Mint Ungváry Rudolf a Magyar Könyvtárosok Egyesülete rendezésében 1987-ben tartott előadásában kifejtette, semmit nem ér a számítógép program, mégpedig jó program nélkül Tegyük azonban mindjárt hozzá, hogy adatok nélkül sem a számítógép, sem a program nem ér sokat. Magyarországon egyelőre még kevés a géppel kezelhető bibliográfiai adatok, adatbázisok száma. Ahhoz tehát, hogy számítógépeink, prog
ramjaink megkönnyítsék a könyvtári munkát és nö
veljék az olvasóknak nyújtott szolgáltatások szinvo
nalat, a katalógusok adatait gépre kell vinni. Ez pedig nem könnyű feladat. Abban a szerencsés hely
zetben vagyunk, hogy a technikai feltételek lassan beérnek a feladat megvalósítására, jó ötletek közül válogathatunk, hogyan is fogjunk hozzá. Talán az is a javunkra válik, hogy nagy könyvtáraink a könyv
tárgépesítés! program elején tartanak, s még nem kötelezték el magukat egyik vagy másik adatrögzítő eljárás mellett. A jelen írás segítséget kíván nyújtani a célravezető döntés meghozatalához. Biztatásul az
/. ábrán néhány nehezen olvasható katalóguscédu
lát mutatunk be, a 2. ábrán pedig azt az e r e d m é n y t , amelyet az OPT1RAM/LIBPACK* rendszer
(Anglia) segítségével készítettek róluk. A számítás
technika jelenlegi fejlettsége lehelövé leszi régi ka
talóguscéduláink adatainak gépi úton való elolvasá
sát és a bibliográfiai adatbázisba való betöltéséi. így katalógusaink visszamenőleges gépre vitele nem látszik r e m é n y t e l e n , távoli vállalkozásnak.
Az itt kifejteit javaslatunk az Informatikai Infra
struktúra Fejlesztés (HF) keretében folyó könyvtár
gépesítés! munkálatok egyik alapvető, általánosan jelentkező feladatára, a meglévő katalógusok adatai
nak rögzítésére vonatkozik.
Tisztában vagyunk azzal, hogy a megvalósításra váró feladat igen nagy igényű még akkor is, ha csak egy máshol már m ű k ö d ő rendszer adaptálására kerül sor. Nem térünk ki most a rendszerből kínál
kozó egyéb felhasználási lehetőségekre (pl. C A D — computer aided design — céljaira tervrajzok beolva
sása vagy egy-egy szótár anyagának feldolgozása), mert figyelmünket a könyvtári katalógusok kérdése
ire összpontosítjuk.
A jav aslat lényege
Az IIE program egyik fő célja a K + F tevékenység információs igényeinek magasabb szinten való ki
elégítése. A könyvtári állományokat feltáró eszkö
zök egyelőre elhanyagolható része van számítógép
pel kezelhető adathordozón. Ahhoz, hogy ezek a ka
talógusok és egyéb nyilvántartások megfelelhesse
nek az I I F követelményeinek, jelentős információs
" A szerző a tanulmány leadása után értesüli arról a L I B P A C K Compuier Services vezelőjétöl. hogy a program fejlesztése si
kertelenül zárull A? O P T I K A M-DI kél egyelem kónyviárá- ban is kipróbállak de az eljárás nem bizonyult cleg haiékonv nak. Az ulólagos javítások lúl sok időt és köllségcl c m é s z t e l - tek föl. — Minde/ck ismerőiében adjuk közre javaslat un kai.
felhiva a figyelmei az ismercies és nem kis nehézségekre, másrészi arra, hogy 1985 óla jelentős fejlődés kóveikezetl be (pl. a C D - R O M megjelenése), új megoldások is szüléitek, amelyek alkalmazása riövelheli a javasolt rendszer várható teljesítményét.
I elcs A.: Optikai karaktérólva$0 rendszerek.
• I o n n a l O k a j i s n . . .
OíilUlt IraiYEÜlW.
í t t l « « » t l c t l J o u m i l . »ol. 12- is«;.
O k a j í . M . J . C . X . U h .
O p o r t o . . .
C P O Í T Q U K l v i a i l T r . r A C U U U T J B D E S C I E S C I A S .
A n t i i d » r i c u l ű a d i d l S e l m á i n . V o l l . 1 4 - J 9 . 1 9 3 0 - 3 9 .
D p o r t O . J C » L i l i .
••• Tor p r v c v d l n g i i a u i * • • * C P O H T O . A C A D K H I A P O H T J X X I C A . A n n i n i t U i l i r i e o i ,
Jojrul
T r l » l * . . .
T R I t £ T £ U i u v * r l i t y . I l l l t u t o d i K l ( * A i t l u ,
R i n d i c o n i 1 . V a l . 1 - 1 9 6 9 -
. T r t a l t * . J C H L l b .
/. íihta
vagyonukat előbb vagy utóbb számitógépes adathor
dozóra kell vinni. Ez a feladat pedig csak egy adap
tív, intelligens és interaktív adatfelviteli rendszer k i fejlesztésével oldható meg. A rendszer a következő főbb elemekből állna:
• m e c h a n i k u s a d a g o l ó ,
• optikai karakterolvasó berendezés, amely kb.
2000 karakter/s. azaz 4 kalalóguskártya/s teljesít
m é n y r e képes,
• adaptív karakterfelismerő program,
• a bibliográfiai és a formai elemekei elhatároló adattárolási program.
• nyelvi és bibliográfiai háttér-adatbázisok és keze
lőprogramjaik.
• helyi hálózat a többterminálos adatrögzítéshez,
• az adatjavítás és -rögzítés hálózati programja.
A fenti komponensekből álló rendszernek képes
nek kell lennie arra, hogy
• kvázihomogén írásképű, rossz minőségű kártyá
kat is elolvasson;
• a bevitt adatokat konvertálható struktúrában tá
rolja;
• a feldolgozást 60 —70%-ban teljesen automatiku
san, 20 — 25%-ban ellenőrzéssel, ül. apró javítás
sal végezze el, s csak a tételek 5 —10%-ánál legyen szükség az adott tétel újbóli rögzítésére részben vagy egészben;
• olyan sebességet produkáljon, amely lehetővé teszi 1—2 milliónyi tétel egy évnél rövidebb idő alatt való feldolgozását (kb. 2000 katalóguskár
tyát egy óra alatt, vagy 2 másodpercenként kb.
egy kártyát).
H i n t — c i c c o i o - M I T I I F I L Í u f o n e D i i t a a t f i c i
[ J U t , 3 1 i n ) . . , „ , 0 0 1 i l i r i l ! . .. P I 0 « - « T I M / C L I I S • I 0 O Í O 1 0 ' I I I • l " S l / l i U i l « M » D I 0 • • • / • . / • • 0 0 1 El 1 1 0 1 1 1 I
íti.J E l l i t n i p i l l c i l J e u r i ' L l » J . . . -. -1 L 1 . I ISi C l l o l . lt~ I l i i - •
J I O f i D k i r u i ' 1 1 0 , 1 1 E l D k l J " ! J n l, , ^ É l T r •
• B& tt 1 E l j : > i l l l l ' I B Ei» i h t l v i d #1 1 t k , i H . . . i » J t u r i u l
; ; . „ „ . , 0 . - I P 1 0 0 1 t M I H i • 1 M 0 I • . n I I K H l . i l - > . 1 0 H E D l a F I L C - l l / O I / l l L I I I I J U N Í E O • . . / . . / - . DOe l a •
M.3 E l I i t p l i D l i - r u l d í J t 0> ' . : . i n L L # , [ . O p i ' l o talviriltr ' • t u l í - d * D l I C 1 M C 1 I 1 • 2 1 1 l i v a l l . 1 1 - 1 1 . 1 1 1 0 - 1 1 i
i a ű [A I p e r T c 1
i n j L• l í n u n j n : O p o r l o . " r j : i i L , • B l r l a t i t l c i . i n n i n l e l i n l l ' l c e i * 1 1 0 . í j ( a O p e r l e O n í v i n l l r ' . ^ . M x . 0« L l l l H i a ! •
ít0 |C i f l J t w i í » K.trH I r , S h . L. d * 1 í a e r l c . . . C l J o u r n a l n q . •
C O m i O L N O . ODI H í , 1 Z i S 2 i B 7 1 3 . 2 1 H ó
l o o r o r o F I L I • i w o i ' í i L i l i I K Ü c n i D - itttry*
• s a ; ] t i I m d i c c A t l 11 y a l . 1 - 1 * 1 5 -
• r i i u i J I r i i i t i J i i t - r i i i i i i
i - i . . : . U M i r a r a i t r I » ' i •• J i >1 l i l t m l l l l
' . I i t l l t f t o 0 1 l i m i t j e i
•fi/ín i h v i v f l d J I rn E i J o u r n a l i * a .
. ' . O / I J H
A feldolgozás módozatait meghatározzák;
• az input fizikai hordozója, jellemzői,
• az input minősége, m e n n y i s é g e ,
• a kivánt gépi output fizikai és logikai paraméterei.
• a megcélzott felhasználási m ó d ,
• az anyagi lehetőségek.
• egyéb szervezeti és irányítási feltételek.
A fenti szempontok alapján lehet választani akö
zött, hogy számitógéppel segített kézi adatrögzítés vagy karakterbeolvasáson alapuló interaktív bevitel történjen.
A két lehetőség csak a feldolgozás első két fázisá
ban, a "nyers"' adatok bevitelében és az adatalemek elhatárolásában különbözik egymástól. A hibaja
vítás, az adatok kiegészítése m á r azonos módon zajlik. Nagy állományok (1—2 millió bibliográfiai tétel) esetén az első megoldás gyakorlatilag kivihe
tetlen.
El kell dönteni azt is, hogy mágneslemezen (módosítható-kiegészíihetö formában) vagy végle
gesen rögzítve, pl. CD-ROM-on fogjuk-e az adato
kat tárolni. A nagy és lezárt könyvtári katalógusok számára az utóbbi megoldásnak számos előnye van
(pl. az egy tételre j u t ó alacsonyabb költség, a hor
dozhatóság, nincs online igény). Még ha egy-három é v e n k é n t az új gyarapodás integrálása érdekében új CD-ROM-ot készít is a könyvtár és a legutóbbi idő
szak gyarapodását m á g n e s l e m e z e n tartja, integrált rendszerrel egyszerre tudja kezelni a teljes állo
mányt. (Itt ennek a részleteire nem térünk ki.) A m á g n e s l e m e z e s tárolás a háttéradatok jobb elérhető
ségét nyújtja a feldolgozó rendszer számára, de ennek határt szab a lemezkapacitás.
Hazánkban a legnagyobb könyvtáraknak milliós állományuk van. a közepesnek 1 0 0 - 5 0 0 ezer egy
ségük. Ennél kisebb állományok optikai lemezre vitele jelenleg még nem tűnik célszerűnek, söt a m á g n e s l e m e z e s tárolási technika bővülésével a kisebb könyvtárak igényei gond nélkül kielégíthe
tők.
A kis és közepes könyvtárak számára a W O R M (Write Once Kcad Manyi lemezes megoldás is kí- n-ilkozik A távolabbi jovőben a törölhető j t v i t h i l o optikai lemez megjelenése e kérdések újragondolá
sát teheti szükségessé.
Más megvilágításba helyezi a kérdést, ha valame
lyik nagy könyvtár az IIF-hálózatba integrálva osz
tott katalógus építését vállalja fel. Ez a kisebb könyvtárak számára a nagyobb gépi kapacitás hozzá
férésének előnyével kecsegtet.
A katalóguscédulák gépi olvasását rendkívül megnehezíti a cédulák kopottsága, az eltérő írógé
pek használata, színbeli eltérése, az Íráskép színe.
Ráadásul a rajtuk levő információk egyes elemei nem állandó sorrendben, esetleg felcserélve helyez
kednek el; az egyes adatelemeket nem mindig ugyanaz a jel határolja el; szükség lehet az aláhúzás
nak mint információnak a feldolgozására is; a karak
terkészlet sokkal b ő v e b b (csak latin belük esetén is) a bővített ASCII-nél. Ugyanakkor megkönnyíti a beolvasási a betüközök és a b e t ű m é r e t viszonylagos állandósága.
A tétel logikai szerkezeiét a különböző címleírási szabványok és a belső könyvtári konvenciók hatá
rozzák meg.
A Magvar Nemzeli Bibliográfia nyomtatott köte
teinek gépi olvasását ugyan a sorkizárásos, kétha
sábos szedés nehezíti, a tiszta íráskép és a jó papír viszont enyhíti a leolvasás nchézségcil. Ez a ha
talmas, jól olvasható adatállomány biztos alapot szolgáltathatna a z ö m é b e n magyar anyagot gyűjtő könyvtárak gépi katalógusának előállításához.
Elképzelhető, hogy igény lenne gépi feldolgo
zásra mikroformákból is, noha ezeken a könyvtári katalógusoknak csak kis hányada található. Az M T A Könyvtára esetleg mégis ezt a megoldást vá
lasztja a mikrofilmlap-katalógus mechanikus kezelé
sének egyszerűbb volta miatt, bár olvashatóságuk esetenként még rosszabb, mint a papírkártyáké.
Az outputtal szemben támasztott követelménye
ink:
• a nyert C D - R O M . W O R M vagy mágneslemezes adatbázis leképezhető legyen az ismert szabvá
nyos formákban (söt esetleg rendszerfüggetlcn f o r m á b a n ) ;
• legye lehelövé a kibővített ASCII vagy vele ekvi
valens, cgybájtos. 256 jelen alapuló kód-, illetve karakterkészlet alkalmazását IBM PC X T / A T , azaz 16 bilcs feldolgozásra; vagy
• m á s , kibővített, nemzetközi szabványon alapuló karakterkészlet alkalmazását, s az itthon várható
an installált könyvtári rendszerekhez legalább in- lerfés/cs illeszthetőségéi;
• legyen indexelhető legalább a szokásos eljárások szcrini (az utalásokat is b e l e é r t v e ) , de lehcioleg más has/nos szempont szcrini is.
A vázoli fejlesztés elképzelése ellen szól
• nagy bonyolultsága,
• a szűk hazai felvevőpiac,
• a külpiac szabványigényei, a lávvállalkozás ne
hézségei,
• a fejlesztési erőforrások hiánya.
A fejlesztés melleiti érvek:
• a feladat aktualitása,
• a hardver- és szoftverfeltctelck nagyjából é r c n e k a sikeres megvalósításhoz (az OSZK és az
Teles A.: Optikai karakterohasn rendszerek..
M T A K várhatóan olyan számítógéphez j u t , amely a multitaszk ü z e m m ó d és a helyi hálózat révén alkalmas lesz a nagytömegű gépi adatbevi
telre),
• a n ö v e k v ő bibliográfiai adatbázis növeli az újabb feldolgozás megbízhatóságát és hatékonyságát,
• a C D - R O M - o n és más adathordozón lévő kataló
gusok már jelenleg is rendelkezésre állnak,
• a hagyományos katalógusok CD-ROM-ra vitele itthon esetleg a Videoton közreműködésével megvalósítható, de a nyugati bérnyomtaiásnak is jól kialakult útja van.
A fejlesztésben érdekelt lehet az OTKA-pályázat felhasználására alakult korlátolt felelősségű társaság ( M T A K . OSZK és S Z T A K I ) , továbbá a Videoton mint gyártó, valamint más potenciális felhasználók.
A fejlesztés m e l l é k t e r m é k e k é n t több, a d o k u m e n t á cióban, a számítógépek irodai felhasználásában al
kalmazható e r e d m é n y , termék is létrejöhet, ami a vállalkozás biztonságát növelheti.
Karakterfelismerő eljárások
A gépi képfeldolgozás, alakfelismerés és ezen belül a karakter (betű, szám) felismerése igen régóta foglalkoztatja a matematikusokat, m é r n ö k ö ket. Ilyen tárgyú elméleti tanulmányok már a hatva
nas évek elején is születtek [ 1 ] , és még ugyanebben az évtizedben az első kísérletek is lezajlottak 12],
A karakterfelismerés feladata elvben a követke
zőképpen fogalmazható meg. Adva van a jelek egy .V halmaza, amelynek elemei egyértelműen az X osztályaiba vannak besorolva. Egy-egy osztály- elemei azonosíthatók egy karakterrel, illetve annak f o r m a v á l t o z a t a iV Ü I, amelyeket azonosnak "olva
sunk". Keresendő egy olyan algoritmus, amely 1. egy ,Y-beli elemről eldönti, hogy melyik osztályba
tartozik,
2. felismeri, ha nem A'-bcli elemmel találkozik.
Az algoritmus értékelése az alábbi hibás döntések valószínűsége alapján történik
• .Y-bcli elutasítása, mint ismeretlen (ún. elsőfajú hiba).
• nem .V-beli .V-be sorolása,
• AT-beIi hibás osztályba sorolása, azaz A-\ lát, de B-\ olvas (ez utóbbi két eset ún. másodfajú hiba).
Világos, hogy elsőfajú hiba esetén lehetőség van a hiba javítására, ami persze lehet időigényes, igé
nyelhet emberi beavatkozást, de nem rontja az output hűségét. A másodfajú hiba viszont csak el
lenőrzéssel tárható fel, automatikus kezelése nem lehetséges. Ezért az algoritmus optimalizálása első
sorban ennek a csökkentését és a lépésszám mérsé
kelt növekedését kell. hogy egyensúlyban tartsa.
(Az irodalomban számos részben vagy elviekben más célfüggvényt is találunk.]
Az algoritmus, illetve a feladat kibővítésével három minőségileg igényesebb megközelítés is le
hetséges.
• Az első egy adaptív algoritmust javasol: az algo
ritmus nagyszámú minta olvasása után maga al
kotja meg az X halmazt és annak osztályait, i l letve a teljes munkafolyamai során lehetséges az
X, illetve az osztályok változtatása.
• A második eljárás lényege, hogy interaktív feldol
gozást biztosit, azaz a felismerési algoritmus során (esetleg az adaptív eljárás egyes lépéseiben) emberi beavatkozást kér vagy tesz lehelövé.
• A harmadik a betűk teljes felismerése helyet!
szavak felismeréséi valósítja meg az alkotóelemek részleges ismeretében. Az eljárás tudatbázisra épít, amely nyelvészeti elveket és szótárat tartal
maz. Ez utóbbi aulomatikus vagy interaktív módon bővíthető, az előbbi pedig esetleg nyelv
től függően változtatható.
Ezeket az eljárásokat részben vagy egészben máris alkalmazzák m ű k ö d ő rendszerekben, de együttes alkalmazásukra eddig csak egyetlen példát ismerünk. (Lásd a konkrét rendszereket ismertető fejezetet.)
Az alakfelismerés! — így a karakterfelismerési — módszerek három nagy csoportba sorolhatók:
• összehasonlító,
• statisztikus.
• struklurális módszerek.
A gyakorlati algoritmusok ezek kombinációját is alkalmazzák, de valamelyik eljárás dominál.
Az összehasonlító módszer a nyers vagy előfeldol
gozott karakter és a tárolt "etalonok" összehasonlí
tásán alapszik. (Ilyen pl. a postai irányítószám olva
sási eljárása.)
A statisziiktts módszer kél fázisból áll. A "ta
n í t á s " során a tömörített alakjellcmzöket leíró kód készül valamennyijeiről. A felismerés során a jelek kódja közt definiált valamilyen távolságfüggvcnyt felhasználva lehel a jelei a legkedvezőbb osztályba sorolni. A tömöríteit alakjellemzö kód létrehozására ma az ún. gyors Kourier-iranszformáctói használják a legszívesebben.
A struklurális módszer egyrészi felhasználja a jel
készlet a priori jellegzetességeit, másrészt az elöfcl- dolgozás és az esetleges szegmentálás (azaz rész
alakzatokra bontás) után az (clemil alakzatot topo
lógiai jellegzetességeivel írja le. Ilyen a bejárási útvo
nal kódja, a relatív hely/el kódja slb. Ezek a kódok az eddigi eljárásokkal ellenlétben nem egyszerűen jelsorozatokat reprezentálnak, hanem a jelkészlet jellegzetességének megfelelő nyelvtani szabályok
nak is elegei lesznek. A felismerés során az alakza-
T M T 35. évf. 1988. 10. s í .
(ol leíró mondai nyelvtani e l e m z é s e vezei el az osz- lályba soroláshoz, vagyis az azonosításhoz. Ez a megközelítés az alakleíró, illetve a formális nyelvek e l m é l e t é r e épít; ezek szabályait, szintaxisát többek közt Chomsky vizsgálta [31.
Napjainkban a gyakorlatban alkalmazott eljárások vagy az etalonnal való Összehasonlítást valósítják meg a viszonylag nagy tárolt jelkészletre építve, vagy a strukturális módszeren alapulnak. Ezek ese
tenként ad hoc egyszerűsítő megoldásokat alkalmaz
nak és a végső osztályba sorolásnál valamilyen sta¬
tisztikus eljárásra kerül sor.
Karakterolvasó berendezések
Az első valódi karakterolvasást végző berende
zést 1912-ben Gotdberg szabadalmaztatta; ez a ké
szülék távírókóddá konvertálta az elolvasott jeleket.
Az első ismert, valóban m ű k ö d ő optikai karakterol
vasó (1914) Foarier d'Aibc nevéhez fűződik. Készü
lékét vakoknak tervezte, melynek segítségével a kézzel vezérelt olvasófej " é r t h e t ő hangol" generált.
Az első m u n k á r a fogott készülék 1954-ben szüle
lett az IntelÜgenl Machine Corporationnél a "Rea- der's Digesl" számára; ez írógéppel ín szövegel tudott olvasni. E cég készített 1959-ben az USA lé
giereje részérc karakterolvasói, amely képes volt kis- és nagybetűs alfanumerikus jelkészletet elol
vasni. A szakirodalom 1960-ban a Szovjetunióban számol be ilyen eszközökről. Ezek és a következő időszakban szüleiéit berendezések két csoportba so
rolhatók: fényképészeti maszkkal tárolt, illetve elektromos (ellenállás-mátrix stb.) etalonok. Ezek a berendezések már a hatvanas évek elején is képe
sek vollak 1000—2600 b e t ü / s sebességű feldolgo
zásra. Később a technikai fejlődéshez képest lassan nőtt a karakterolvasók teljesítménye.
Az elmúlt harminc évben a feladatspecifikus be
rendezésekel lassan felváltották az általánosabb, sok célra felhasználható készülékek. Megszűnt a technikai megoldások széles skálája, kialakult egy viszonylag általános eljárás, amely a beolvasandó in
formáció fizikai fogadásához analóg-digitális átalakí
tót alkalmaz és löle elkülönítve a digitális jelek értel
mezésére szolgáló számítógépei, illetve célberende
zést. Az olvasóegységek legfontosabb fajtái;
• iv-kamera bemenete,
• CCD töltéscsatolt k é p b o n t ó .
• lézeres letapogatással m ű k ö d ő berendezés.
A jelentős változást a töltéscsatolt berendezések (CCD) megjelenése hozta a hetvenes évek elején.
Ezek napjainkra a felbontás jelentős mérvű növelé
sét tették lehetővé, igy az input információ sokkal alaposabb e l e m z é s é r e adnak m ó d o t . Csökkent az irásképpel és a papírminőséggel szemben lámasztoit k ö v e t e l m é n y , gyorsult és finomabbá vált az infor
mációfeldolgozás. Napjainkban szabványként emle
getik a 300 poni/inch (kb. 120 pont/cm) felbontási, de természetesen ennél jóval nagyobb felboniású készülékek is találhatók a piacon. (Egy A4-es oldal
ról 1 Mbájt információegységet olvasnak le a szo
kásos készülékek, tehát kb. egymillió betűnek meg
felelő információ szükséges egy A4-es oldalon lévő kb. 1800 jel megbízható azonosításához.)
Az alábbiakban a teljesség igénye nélkül ismertet
jük az 1980 után forgalomba került néhány beren
dezés nevét és gyártóját, valamint főbb paramétereit [4]. (Általában a többféle betűtípust feldolgozni képes készülékek esetében is szabványos jelkészle
tekről, pl. a leggyakoribb írógépek betűtípusairól — Courier 10, 12 vagy Prestige Elité 12, Pica stb. - van szó.)
Alphaword3 + (1985 e l ő t t ) . Formscan Compuscan.
120 jel/s, azaz 145 lap/óra, online javítás, 300 000 jelenként egy hiba. tízféle (szabványos) jelkészlettel bővíthető, de alapul egy jelkészlet szolgál. Ára: 22 850 font.
Series 80 A . B. C (1985 e l ő t t ) . Formscan. 145 lap/óra, 1, max. 3 belütipus. Ára: 11 500 font.
Dest Worklcss Slation Modcl 21 1, 212, 213, 222, 223 (1982), Lexisystem. Képes sorkizárt szöveg olvasására, jobbra és balra zárt bekezdések értel
mezésére, max. 12 belütipus olvasására automa
tikus beiütípus-kiválasztással. Többféle betűtí
pust is olvas egy lapon belül. 145 lap/óra. Nincs saját billentyűzete. Ára: 8 0 0 0 - 11 500 font.
Omni-Reader (1985. j a n . ) , Oberon Inlernaiional's.
25 b e t ű / p e r c , kézi mozgatású olvasófej, négy jel
készlet. Sajátos tagja az O C R - t e c h n i k á n a k , olcsó, egyszerű, mégis számos igényt kielégít. Ára; 500 USD.
Palantir Compound Document Processor (1986), Palaniir Corp. Etaionos összeállítás, 0,25 — 2 ol
dal/perc a betűkészlettől függően. Ára: 40 000 USD.
OCR 6001, Sepsi (francia cég). 9 nyomtatott be
tűtípus, min. 7,5x12,5 cm, max. 21,5x35,5 cm.
Lapméret; 250 lap/óra.
A továbbiakban bemulatott olvasókészülékek az ún. ICR- (Inielligent Character Reader) családhoz tartoznak. Közös jellegzetességük a tanilhatóság, i l letve az automatikus adaptivitás, a nagy háttérinfor
máción alapuló intelligencia. Tulajdonképpen olva
sásra, érzékelésre kialakított mesterséges intelligen
ciát képviselnek. Ennek a családnak az első és talán leghíresebb tagja a Raymond Kurzweil által kifejlesz
teti
Teles A . : Optikai karaktéról vasó rendszerek..
K u r / w c i l 4000 (1983). Kurzweit Computer Products, Cambridge Mass (USA,. Struklurális. topológiai eljárással képes é r i n t k e / ö karakierek szétválasz
tására, illetve hiányos vonalú karakterek felisme
résére, szerkesztési forma visszaadására. Ára:
34 500 USD.
K D F M 1100, K D E M 1200. Compaci Computer G m b H ( N S Z K ) . Tanítható, 250 000. illetve
160 000 jel/óra. 6500 D E M havi bérleti díj.
Meg kell különböztetni az olvasókészülékeket és a karakter felismeréséhez szükséges programokat.
Egyre szélesebb körben terjednek el az ún. "dcsk- top", azaz asztali olvasókészülékek, amelyek mini
vagy mikroszámítógéphez csatlakoztathatók aszink
ron kimenettel. Bár a gyártók természetesen karak
terfelismerő programot is kínálnak hozzájuk, lehe
tőség van más programok alkalmazására is a szabvá
nyos csatlakozással. Ilyen készüléket majd vala
mennyi hardvergyártó kínál az IBM-től kezdve az AGFA-ig. Töltéscsatolt kamerát a Híradástechnika Szövetkezel is gyárt, amely ugyan nem irodai alkal
mazásra való, de felbontási és egyéb paraméterei alapján alkalmas karakterolvasásra.
Az 1987-es őszi BNV-n mutatták be az SZKI nemzetközi érdeklődést is kiváltó RECOGNITA ka
rakterfelismerő programját. Az algoritmus struktu
rális módszert használ, és képes új karakterek meg
tanulására is. A rendszer irodai célokra készült, ezért a benne felhalmozott jelentős intelligencia el
lenére lömegléldolgozásra, gyengén olvasható input fogadására nem célszerű felhasználni.
A katalógusok visszamenőleges beviteléhez szükséges berendezések ma elérhető áron beszerez
hetők, a feldolgozáshoz szükséges algoritmusok, i l letve programok megvannak, megvásárolhatók, i l letve kifejleszthetők.
A nyugati informatikai piacon megjelentek azok a vállalkozók, akik olvasóberendezés és számítógép birtokában széles skálán vállalnak feldolgozást, minden elképzelhető kapcsolódó szolgáltatással együtt.
Hagyományos katalógusból géppel olvasható katalógus
A hagyományos katalógusnak géppel olvasható katalógussá való átépítéséi nagyban segíti, ha vala
hol már hozzáférhető valamilyen, az átépítést ter
vező könyvtár állományát legalább részben lefedő gépi katalógus. Ennek online vagy offltne felhaszná
lása jelentősen megkönnyíti a feladatot. Igénybevé
telénél esetleg az okozhat nehézséget, hogy a fogadó fél házi szabványa eltér a felhasznált adatbá
zisétól. Ezek a nehézségek nem mindig hidalhatok át az átvételkor.
A tapasztalatok szerint a kézi bevitel igen sok hiba forrása, ami a gépi visszakeresési lehetetlenné leszi; ugyanakkor adatok bizonyítják, hogy a gépi ol
vasás lényegesen olcsóbb, mint az emberi munka [5],
A O P T I R A M / l . I B P A C K rendszer
flarrisot} cikkében [6] egy igen fejlett OCR-, il
letve ICR-technológiára épülő, retrospektív kataló
gusfeldolgozó rendszert ismertet. Az O P T I R A M / LIBPACK rendszer hardverkonfigurációja a követ
kező elemekből áll:
• C A N O N F A X 3 2 0 E ( G r o u p 3 ) .
• M C VESCA számítógép I Mbájt memóriával,
• 80 Mbájtos winchester-lemezes tároló,
• ellenőrző terminálok,
• Dala Scope (a feldolgozott információ ellenőrzé
s é r e ) .
• PERTEC, 9 csatornás mágnesszalagegység (800 és 1600 bpi-s inicrfésszel).
A beolvasást egy közismert lelefakszimilc beren
dezés végzi, a nyers információi pedig egy nagy bo
nyolultságú intelligens program bontja egyedi karak
terekké. F.lsö lépésként a mágneslemezen található mintákkal hasonlítja össze a jeleket és ASCII kódol generál belőle. A továbbiakban egy, a karakterfelis
merési eljárásokról szóló fejezetben ismertetettektől drasztikusan különböző módszer! alkalmaznak.
A szóképolvasás
Az elöfeldolgozás ulán minden egyes szól meg
vizsgál a rendszer, hogy szerepel-e a szótárában; ha igen, azonnal outpuira kerül. Ha nem, akkor a nyers inputot behatóan újra elemzi. Ezulán a szót végül is vagy megtalálja a szótárban, vagy elfogadja annak ellenére, hogy a szótár nem ismeri, mert a benne szereplő jelek pontosan felismerhetők, vagy pedig nem fogadja c l , mert a jelek nem ismerhetők fél. Egy új szó akkor kerülhet be a szótárba, ha
• minden karaktere nehézség nélkül felismerhető, vagy
• a benne szereplő hangzók egymásutánja eleget lesz a nyelv ezekre vonatkozó általános szabályai
nak.
A szótárat a felhasználó kívánsága szerint bővít
heti. A rendszer kiterjedt hibajavító eljárásokat tar
talmaz. A nem elfogadott szavak is outputra kerül
nek, de ezekéi a rendszer kívánság szerint megjelöli.
Az OPTIRAM leolvasó képes kézzel írt alfanu
merikus szöveg feldolgozására. A feladat bonyolult-
T M T 3 5 . c v f . 1988. 10. S Í .
sága lassítja a feldolgozást, de amint az 1. és 2. ábra mulatja, az e r e d m é n y rendkívül jó. A kézírás felis
m e r é s e vegyes, strukturális és etaionos módszeren alapszik. Nehéz esetekben a statisztikus döntési el
járás "legjobb tipp"-jét helyettesíti be a rendszer, amelyet azután a szótári ellenőrzés hagy helyben.
Speciális eljárások gondoskodnak
• a megszakadt vonalak kitöltéséről;
• a papírhibák, foltok, összemosódások zavaró há
lásának kiküszöböléséről;
• az áttetsző papír, a színes nyomás, a szakadások, eltűnt jelek okozta nehézségek leküzdéséről.
A rendszer nagy ereje tanulási képességében rejlik, amely a korábbi tapasztalatok felhasználásával növeli a felismerés sebességét, biztonságát.
A jelkészletre semmilyen korlátozás nincs 161. a rendszer minden latin betű, minden európai nyelv ékezetei és diakritikus jelei, minden szokásos speci
ális karakter, az alsó és felső index, a matematikai jelek, a görögjelek feldolgozására képes. Tervezik a
cirill betűk é s a héber jelek bevonását is.
A rendszer U K M A R C és L C M A R C feldolgozá
sára é s előállítására alkalmas, de szó van az ISO- karaklerszabvány minden lényeges elemének átvé
teléről is. A nem szabványos jelek transzliterálását a felhasználó szabhatja meg.
A LÍBPACK formaelemző a szöveg kezelése mel
lett lehetővé teszi a kártyakép feldolgozását, pozi
cionálását, azaz az egyes adatelemek funkcionális el
határolását, felismeréséi és kapcsolataik rögzítéséi is. Képes követni a katalóguskártya formaváltozatait akár k ü l ö n b ö z ő könyvtárak katalógusairól, akár egy könyvtár katalógusán belüli változatokról van szó.
A felhasználó kívánsága szerint el lehel hagyni bizo
nyos adatelemeket, felcserélni mások sorrendjét a rekordban.
Harrison szerint a katalóguskonverziónál az alábbi tényezőket kell figyelembe venni:
• költségek,
• a programok irányítása,
• hozzáértő szakembergárda megléte, illetve alkal
mazása,
• a minőség ellenőrzése,
• megfelelő szabványok.
1985-ben e, rendszer segítségével a gépre való át
vitel katalóguscédulánkén! a bonyolultságtól függő
en 30 penny körül mozgott, mig a hagyományos m ó d o n az USA-ban 1,55-3 dollár, Angliában 1 - 5 font volt az átlag.
Harrison példáit az 1 —6. ábrákon közöljük. Ezek a rendszer hallatlan erejét bizonyítják. Az 1. ábra három katalóguscédula másolata, a 2. az ezekről
INK H»S HOT BULI ! E E H U S E F U L I N I l L l ü t S , S U T S T I L t C O M T I B U E S
• S S O L U T E I T H E C E S S W Y 1 0 T H E P f l E 5 £ « Y » t ION A B D IAPP.OVEMENT O F i . • r ' É r t l o d l a l a i v a , <Bd f o r
t r u l IC T l ° n • o í I l i * .
s d t f c t l D i 1 4 * p r d l n a i r
0*11* r i p f l r t e n c r . í h u r l . T r . i l I h í m o l l corwf O D J u l s . o m f r n l l y p r o v t m ű i t U 4* ' u l i n d b r i r V L c i » l 10 « n l 1 n d . Thf í o n i t l n t K C H l a n *t n i r t f o r ínk, f l - ' . r s I I I t o n t e n l í f l í f i n d u l l l l l y . I V w f Ihu t n p a r í a i t t m / U l áriáiig to aociily / r ö n itt tfd, tnd I * * fo/üKfl i ii i " if i i f l ! • miy HdffAP / .- - thi frsvát of d*tir,i*g tSt QPuri of thít H t t f a H a r f orlielt. it i « co 0< uitStd ttet t\4 l - a í f l l a t u r * i » l i l d frer*
i<r* r í p x l ű í í ű i t o pnrvt* itt Í T r c t f í * * 11. ű"d" p r* v r i t Vnavny W d w j K c * fKn it I n l t r u o i E n t d l t o C h t s e c o r a p1 1 1r i r o o n t • o l i r
• a a e p u c p o B * .
\}-U$M c ^ \ A tÁe^- H
készült M A R C rekord. A 3. ábrán k ü l ö n b ö z ő be
tűtípusok és kézirás látható, a 4, ábrán ezek gépi ol
vasata, a megfelelő tipográfiai adatokkal. Az 5. ábra könyvbeli szöveg, a 6. ábra ennek olvasata.
É r d e m e s megfigyelni, hogy a szedett szöveg sorki
zárásos, többféle címet és bekezdésmódot tartal
maz, amelyeket a rendszer szintén visszaad. Az output szövegben > . . < jelek közt található a tipog
ráfiai utasítás. Ezek a következők lehetnek:
as: kisbetű fc: betűtipusváltás h l : cím
h2: cím (antikva, középre) it: kurzív
10: bekezdés folytatása 11: bekezdés kezdete gc: bekezdés középre zárva ql: bekezdés balra zárva ro: antikva
t l : szöveg kezdődik (cím után) xs: kisbelű vége
Az elválasztott szavak jelölésére (ez katalóguscé
dulán nem fordulhat elő) a + jel használatos.
Teles A . : Optikai karaktéról vas 6 rendszerek...
i h lii H l S i q | j
l l l M t l c l N O t a l H P S N O T D H L T B É E H U S E F U L [ N Í * _ L A G E S , B U T S T I L L C ü N T I N L C S flíJSŰLUrfLr N e C £ S 5 W . ¥ T D T r C P R E S f T R U f l T I R H D | J f > f t * C K H f O F> N* ( í q t <
> 1 0 ( ] t c i í v * r v * r t * n d i c l i n c t , * n d f a r C D f l d k l c t l n g t h » o r - d i m r y l r i n n C t i O. i t O f Lí r *. i q l l
Í 1 1 ( tlc c D * L l y " • p i ' i m t t i h i - i . t h a i t h * m a i l commci-. c b j t c l i . c i n i n l t y p r u v f m a t l u u ' u L i n d h a n t i Íj c l t i l a m i n * I n d . T h t r c o m t a n L o c c a t l a n w * h a v r
for I n l t , a v i n c r i I t t t a r v v a n l a n c a m d u t U l t y , 111 ( > f c . F r o n t h * f m p o r l i n t h i m f i i i t r l i i n g t a i c c l t t y f rom I I * u n . a n d t h t i n l u r l a * J n d l w l d u a I • may
luftot í r o m t h * í r # u d i o f d a i l g i M n g i m n I n t h r a b u i a a f Í M * n a c t t l - t r y
• r t l d t i i t l l l O b r w l i h i í t h i l ( h t 1 t g l l l * t u r a w u u t d f r m v I O I K I r t g u l a t i a n <o o r o n- o t a 111 L a i p r o v t i n a n | , a n d p r a v a n l k n a v t r y i n d t v i r J c i í r nm ö n k i i i g t t i F o í J f c t i n t t r u f f * -1 i l 1D t h * a c c e m p l i i h t r v a n t I a f a n y h i t t
p u r p o n . ) q t |
i M Í > t i í S L r n a l j / 41 . [ h » c ü m p j i l t i o n a f L n k m i y b e t h a u g h l , i n d n • I I y 11, H L i * w p i i k n e ^ - f j t c t j t h « t « t h a w t i t p r t t . t r. 1 n o n * a q u » l I n b a a u t y a n d c o l o ^ r t o I h a t u i a d b y t h a a n c l r n t • . i q l i
U l f T i k t r . í r o f n " T n a G a l t a r y o f M a t ú r a i n d ö r f b y t n a R t - , E d w a r d P o I p n a. T^ t u n , 1 S 1 S > q< |
4. ábra
2 8
B u c i OR G A H D E N N I G B T S I . A D E , Scítmani nigrum, P L I T E X I V ,
haa proved falai in serpral cascs. ita c-fT^ct Ü being more poweríul tbrin tbcsc produced by the Bitter-a*eet, thougb aimilar in nature. T b c plánt ia SDDU&I. riaing ta tbc beigbt of oae or two feet. and beaxiog imall white flowera reaembliog those nf tbe la=t mention ed i n form, The bemes. prhen maliire, arc black. It ia a coramon weed in gardena. by waysidei. and about manure heapa. Liké tbe Woody Night-
•had«. it h u n Mim?times been í m p l o y e d in medicine.
H E Í Í H A N E , iíjfűicjamuj n i j f r . P L Í T K XV.
An BDDiiaJ plaat. not uncornTnon in í o m e párta of tbe country iu waate groixod D Í Í T towns and TÜlagpa, geoeríJ]y in dry placea or about rubbisb beaps. It growa írom a few íocbfa to a foot or more in heighl. with dovmy atems and líaepa. baring a atroogly fo^tid odoor, Tbe flnwen art grceoiab-ydlow, generally, with dark veina forrni cg a network (jvcy the corolla, but aometimea of a patc yellow aod witbout T e i n s j tliej arc produced iu July and Auguit. T h t wbole berb ia poiaonoo.9 to man, tbnugb apparently haviug IjtMe elTect 0 0 domestic c&Ule and baraea. It occuiona delírium aod atupor, accompamed b y g r t a t dilalatiou nf tbe pupil of tbe eye. Tbe seeda bave been uaed for amoleing, aa a reroedy for tocihache. but abould n e v e i be employed, having caused coovulaioaa, ami even inunity, in lomé iDsUaceii The leavea arc tbe moit powerful portion of tbe p l á n t ; even tbe odour of tbeae, wben frteh, will produce giddinesa and atupor.
Two fat&l cava at leaat of poiaoning by thia plánt ate re-
T M T J S . é v f . 1988. 10. s*.
] h 2 c B > a * i L f l C K O B 1 . . 1 O u j i C H D e N i . n N i n i I G H I S H R O E . > « « i I i 1 < S a l i n u m n i g r u m . > r o < P m < L C j T E > n * c X I U . l q r <
> 1 I ; > • 1 < h . . - . p r a v * d f a t á l í n * a v * r a t I M I I , I I I p f f p c t s b * l n g m o r f p a t r a r f k i l r h- . i r p r o d u c a a T b y t h * D l t t* r t* w * t t , t h a u g h l l a l l v r i n n a t ú r t , T h a
p l á n t i * a n n u a l . r i t i n g t o t h a h a i g h t o f o n a o r t w o í a r t . a n d b t i r i n g i m a l l v h i t a f t o v p r i I h o a a a f t h p I n t m a n t i o n p d i n form. T h a b a r r i a a ,
- ' r • m a t ú r a , a r a b l a c k - M i * a c o i r t n o n v a a d I n g a r d á n * , b y a n d
a b o u t f n a n u r * h p a p * . L i k a t h * w ű o d y N l g h t i h a d * . i t h a * l o m a t i r n a * b * * n r n p l o y c d i n j n a d l r i n * , t q l t
) h 2 ( H > a * < E N B O N £ . I H I 1 i t ( H y o n r y a m u i n l g t r . l r o l P ) a u L O T E I M I t X U . I q c l
> M í > t 1 í i M í P n a n n u a l p l á n t , n o t w n c o a i w n i n l o i a p á r t a o f t h a c o u h t r y i n v a l t a g r o u n d n a a r ( a n d v i l i i g * * , g v n t r a l t y i n d r y p i a c a * o r a b o u t r u b b l s h h * a p * . ti g r o w * f r o m a f a t r i n c h * * t o 1 f o n t or m ó r * í n h r í g h t , w i t h
d a v n y * t * m * a n d l a t v a i , h i v i n g a í t r o n g l y f ) * 1 < t i d o d o u r . T h * f l o w t r * i n g r t a n í i h t y r l L u v , g a n a r i L l y , w i ' . h d a r k « r i n i f a r m i n g a n a l w o r k o v p r t h *
c o r o l l a , b u t * o m * t l r n* K a f a p a l p y a l L n w a n d w l t h o u t v * i n * j t h a y a r a p r o d u c a d í n J u l y a n d Q u g u i t . T h * w h o t t h * r b it p o i s o n o u * t o m i n , t h c u g h a p p a r a n t l y h a v l n g l i t l l * * f f a c t o n d o m a t t i c c a t t l a a n d h a r i p * . I t o c c a t í o n * d a l i r i u m a n d i t u p o r , a c c o m p a n i a r i b y g r a a t d í l a t a t i o n o f t h a p u p l l o f t h a
* y * > . T h * * p a d * h a v a b a a n u s p d f o r i m o k i n g , a l > r e m t d y f o r t n o t h a c h * , b u t i h o u l d n p v p r b r p m p l o y p d , h a v i n g c a u * * d c o n v u l * í o n *H a n d a v a n i n a a n l t y , í n t o r n a i n * t # n c * t . T h * t p a v * * a r * t h * r n n i t p o v e r f u l p n r t i n n o f I h a p l i n t j p v * n t h a o d o u r o f t h r t t , w h r n f r r i h , v i l i p r o d u r * g i d d i n * * * a n d i t u p o r . T v o f j t t a l m a * a t l a a t t o f p o i i o n i n g b y t h i * p l i n t a r c r * * > q j (
f>. á/llll
A katalógusok visszamenőleges konverziója C D - R O M segítségével
Az első C D - R O M kiadványok közi jelent meg a Lihrary of Congress (LC) angol, idegen nyelvű és Any-book (szerzeményezési) katalógusa a Library Systems and Services és ettől függetlenül a Library Corporation gondozásában. Már a kettős kiadás is nagy piaci sikert sejtet. Azóta további C D - R O M kiadók is megjelentek az LC katalógusának valami
lyen formájával. A C D - R O M könyvtári alkalmazása eddig két területen kezd komoly méreteket ölteni [7]. Az egyik a katalógusok retrospektív konverzi
ója, a másik a s z e r z e m é n y e z é s . Az utóbbi a kiadói listákat tartalmazó CD-ROM-okra, az előbbi pedig valamely könyvtár katalógusát tartalmazó C D - ROM-okra támaszkodik. Mindkét területen számos intelligens szoftvermegoldás könnyíti a könyvtárak munkáját, egyes CD-ROM-ok online hozzáféréssel, illetve online rendelési lehetőséggel vannak kiegé
szítve. (E helyütt nem térünk ki a szerzeményezést segítő C D - R O M t e r m é k e k r e . )
A visszamenőleges katalógusépitést C D - R O M szolgáltatásra alapozó vevő bízvást számíthat arra.
hogy a kezelőprogram segítségével a házi szabvány szerinti formában kapja meg a bibliográfiai rekordo
kat, s k é n y e l m e s szövegszerkesztő program segiti a rekordban esetleg szükséges módosítások végrehaj
tását, a CD-ROM-on nem található tételek kézi be
vitelét. Az alkalmazott rendszerek könnyen átte
k i n t h e t ő , egyszerű, funkciói között m e n ü r e n d s z e r segítségével navigálhatunk. A bibliográfiai tételek sok közvetlen elérési ponton keresztül visszakeres
hetők az adatbázisban. A keresést logikai operátorok és csonkitási lehetőség könnyíti. A rendszer segítsé
gével katalóguscédula é s címke n y o m t a t h a t ó . Felis
merve a CD-ROM állandósága és a katalógus bővü
lése közti ellentmondást, egyes kezelőprogramok úgy vannak kialakítva, hogy a winchesteren és a C D - R O M - o n tárolt rekordok közt úgy keres, mintha egyetlen adatbázist alkotnának. 1987-ben a következő rendszerek álltak rendelkezésre:
Bibliofilé. Library Corporation. Az első ilyen típusú termék, amelyet napjainkig a legtöbb, ezernél több példányban adtak el. Az adatbázis 2.2 millió
Teles A.: Optikai karaktérólvasn rendszerek..
angol nyelvű rekordot tartalmaz négy lemezen, egy továbbin pedig egymillió idegen nyelvű rekordot. A bővíteti szolgáltatású rendszer a következőket kí
nálja: max. nyolc munkahely helyi hálózatba kapcso
lása és egy közös adatbázishoz való kapcsolódás; vo
nalkódolvasó; 340 Mbájtnyi (láncba köthető) winchester-lemez a helyi adatbázis tárolására. A rendszer egyetlen gyöngéje, hogy nagykönyvtárak számára nem igazán magas a találatok száma, azaz a fogadó könyvtár katalógusa és a C D - R O M állomány közös tételeinek száma nem teszi ki az állomány túl
n y o m ó többségét. Ezért szükséges más gépi kataló
gusforrások bevonása is.
LaserQaesl, General Research Corporation. 1986 júliusában jelent meg, jelenleg 100-nál több instal
lált példánya van. Az állomány 4,5 millió rekordot (2,2 LC, 2,3 kiegészítés) tartalmaz három lemezen;
a negyedik lemez 260 ezer kanadai könyv C A N - M A R K adatait tartalmazza.
Spectrum 400, 800, 1000, Library Systems & Ser
vices Inc. A Laserfile 2,2 millió rekordjára épül, s várhatóan a N I C E M adatbázis adataival is bővül.
Igen drága rendszer, viszont a személyi számítógé
pektől kiépílhetö egészen a sok munkahelyes M I C - R O V A X rendszerig.
CD-CATALOG-OCLC. Az OCLC 1981-től fel
vett 1.4 millió tételét, továbbá az LC 1,8 millió téte
lét tartalmazza. Az OCLC tagkönyvtárai számára készül.
D/SCON-UTLAS.-DISCON. Az UTLAS tagjai számára készült katalogizálási segédeszköz. Az
TELCS András: Optikaikarakterolvasó rendszerek könyvtári alkalmazása
Az o p t i k a i k a r a k t e r o l v a s ó b e r e n d e z é s e k é s algo
r i t m u s o k f e j l ő d é s e a k t u á l i s s á t e s z i a k ö n y v t á r i a d a t b e v i t e l a u t o m a t i z á l á s á t . A t a n u l m á n y ennek a fel
a d a t n a k a f ő b b f e l t é t e l e i t i g y e k s z i k á t t e k i n t e n i , be
m u t a t v a a n e m z e t k ö z i s z a k i r o d a l o m b a n t a l á l h a t ó e r e d m é n y e k e t .
* * *
TEJIH, A.: npMMCHCHHC OÜTIWCCKHX 'IHT3IOIUHX yCTpOHCTB B ŐHŐJlHOTeKaX
B B C ^ C H I I C H p a - J B í i T i i e o n T H 4 e c K M X H H T a t o m n x VC'TpOÍÍCTB H 3J1 TOpHTMOB C03flaj]H a K T V a J l b H O C T h U B T O M U T i n a U H H BBOfla n a H H b i x I I ÖHÖJlHOTeKaX,
A B T O P nbiTaercfl p a c c M O T p e T i > ocHOBHbie ycno-
BHfl 3 T o r o 3aflaHH5i H n p o f l e M O H C T p u p o B a T b p e - - j y j i b T a T h i . njJto>KCHHh]e B H a y i H O - T e x H H M e c K o í í
jiHTepaType.
összes 1984 előtti LC rekordot és a R E M A R C adat
bázist tartalmazza. A négy lemez és a terminál havi bérleti díja 800 USD. Az automatikus feldolgozást sokkal megbízhatóbbá teheti e háttérkatalógusok al
kalmazása. Ezzel az olvasást a szótári összehasonlí
táshoz hasonló támogatással lehet ellátni, azaz e cél
feladat esetén betű-, szó- és kártyaképolvasásról együtt lehet beszélni. A feldolgozás megfelelő fázi
sában néhány azonosított szó (név) alapján keres
hetjük a háttérkatalógus azonos tételét; megtalálása, ill. pontos azonosítása után a további olvasást mel
lőzve á t e m e l h e t ő a tétel készülő katalógusunkba.
Irodalom
III F A N S T E I N , A.: Osnovi leonj informacij. Moskva. 1960.
[21 K O V A L E S K I J . V. A . - S L E Z 1 N G E R , M. Y . - R I B A K . V. ].: CitaűSie avtomati i ras pózna van ie obrazov, Naukava l í u m k a . Kiev. 1965.
[31 H O P C R O F T . J. E . - U L L M A N . J . D.: Formai languages and ihcir rclalion to automata. Mussachusells. 1969.
|4| S C H A N T Z . II. I7.: O C R dala entry systems: curreni and future uses. = The Office. 91. kői 2. sz. 1980. p. 58. 60.
63. 65.
[51 M O R T E N . II.: Oplical scanning for reirospeciive conver- sion of informaiion. = The Electronic Library. 4. köt. 6.
sz. 1986. p. 3 2 8 - 3 3 1 .
[6] H A R R I S O N , M.: Reirospeciive conversion ofeard catalo- gues inlo full M A R C formai using sophisticaied computer-eonirolled visual imaging lechniques. = Pro
gram, 19. köt. 3.sz. 1985 p. 2 1 3 - 2 3 0 .
[71 J O N E S . R.: Compact disc technology; Developmenis and Standards. = Dala Processing. 28. köt 6. sz. 1986. p.
295-298.
TELCS, A.: Library applications of Oplical Character Recognition (OCR) technology
The development results ofoptical scanners and character recognition algorithms made the automa- tion of library data recording by OCR systems feasi- ble. The state-of-the-art and main trends of the ap¬
plication of OCR technology in libraries are over- viewed, based on the imernational literature.
TELCS, A.: Die Anwendung der optischen Zeichenleser-Sysfeme in den Bíhlioiheken
Die Entwicklung der optischen Zeíchenleser- Systeme und Algorithmcn macht die Automatisie- rung der Datcneingabe in den Bibliotheken aktucll.
Die Studie bestrebt die wichtigsten Bedingungen dicsér Aufgabe z u überblicken, in dem sie die Er- gebnisse in der internationalen Fachliteratur darstellt.