kezdőlap  -     BIOinformatika      -   kezdőlap

2010.01.5.
1. Informatika és internet

Gutenberg óta a legfontosabb és legmegbízhatóbb információhordozó a papír. Tudományos folyóiratok és könyvek megszámlálhatatlan sokasága bizonyítja ezt a biológia területén is. A számítógépek és az őket összekötő világháló megjelenése új korszakot nyitott az információ áramlás és -feldolgozás területén is. Lehetővé vált a rendszerbe betáplált adatokhoz való gyors hozzáférés, legyen bár a felhasználó és az információhordozó akár a világ egymástól távoli pontjain.

Folyamatosan jelennek meg friss és új információk. Egyre nagyobb és változó adathalmaz vesz körül bennünket, ami azt is jelenti, hogy bizonyos adatállományok, címek egyik napról a másikra el is tűnnek.  

Egy internetoldal "féléletideje" négy év körül van, így érthető, hogy egy internettel foglalkozó összeállítás nem lehet teljesen naprakész. De éppen a rendszer előnyeit kihasználva lehetőség van  a  frissített anyagot magán az interneten mindenki számára elérhetővé tenni.

E lapokon felsorolt szoftverekhez, illetve a különböző bemutatott szolgáltatások legtöbbjéhez ingyenesen hozzáférhetünk a világháló segítségével. E jegyzetben felvázolt alapismeretek birtokában mindenki képes lesz önálló további tanulásra és a saját érdeklődési körének megfelelő mélyebb ismeretek megszerzésére.


1.1. Az informatika fejlődése

 Egyes elemzések szerint a publikált információ mennyisége 1880 és 1930 között 50 év alatt duplázódott meg, majd ezt követően 1960-ra (30 év), illetve 1970-re (10 év) nőtt a négy illetve nyolcszorosára. Napjainkban kevesebb mint 18 hónap alatt kétszereződik meg a tárolt információ.

Az információ tárolás és feldolgozás a számítógépek fejlesztésének köszönhetően szintén nagy léptekben fejlődik. Jól érzékelhető ez az információ tároló eszközök kapacitásának, az adatátvitel sebességének, vagy a processzorok teljesítményének  növekedésében.

Gordon Moore, az Intel egyik alapítója feltételezte, hogy a tranzisztorok száma a félvezető chipen 18 hónaponta fog  megkétszereződni a technika fejlődésének köszönhetően. Az elmúlt több mint 40 évben ez a jóslat valósnak bizonyult (1.1. ábra) Ma reálisnak tűnik a hasonló ütemű növekedés a következő 20 évben is. Így 2012-re 100 millió tranzisztor és 10 GHz lehetnek a jellegzetes paraméterei egy chipnek. 

1.1. ábra: Az Intel processzorok fejlődése, tranzisztor tartalom millió processzorban kifejezve. Az Intel4004 processzor még csak 2300 tranzisztort tartalmazott, a Pentium II  7,5 milliót, a Pentium IV több mint 40 milliót.

1.2. Elektronikus levelezés

Az e-mail (elektronikus levél , e-levél, drótposta) a legkedveltebb elektronikus kommunikációs eszközzé vált az elmúlt 10 évben. Népszerűsége annak köszönhető, hogy kényelmessé és rendkívül gyorssá tette a levelezést. Míg egy hagyományos levél két hétig is vándorolhat Magyarországról Japánba vagy az Egyesült Államokba — és a meglehetősen drága gyorsposta kézbesítése is napokba telik —, addig az e-mail gyakorlatilag az elküldést követően azonnal megérkezik a címzetthez, olcsó és a rendszer lehetővé teszi, hogy egyetlen nap alatt akár tucatnyi üzenetet is váltsanak az egymástól sok ezer kilométerre lévő partnerek.

A kommunikációt tovább könnyíti, hogy az e-mail lehetőséget nyújt körlevelek küldésére, a beérkezett üzenetek osztályozására, a címek elektromos tárolására, csoportosítására. A rövid üzenetek mellett — csatolt dokumentumként (attachment) — a különböző számítógépes programokkal készített rajzokat, képeket, formattált  szövegeket  is  továbbítani lehet,  a  megfelelő

átalakítás (kódolás) után. Ezt ma már sok levelezőprogram automatikusan elvégzi, még kényelmesebbé téve az üzenetváltást.

Természetesen az e-mail is elveszhet útközben, de célba érésének igazolására szintén van mód. Egyetlen komoly hátránya, hogy könnyen juthat avatatlan kezekbe, könnyen elolvashatják mások is, de a legtöbb esetben ez nem jelent lényeges veszélyt egy egyetemi,  kutatóintézeti környezetben.

Az e-mail cím első része tartalmazza a személy (szolgáltatás) nevét. Ezek után következik az @ (at) jel, a "kukac", melyet a helycím (domain name) követ, legvégén az országra való utalással. Ez alól kivételek a .com, .edu, .org és .gov végződések, melyek mind az USA-ra utalnak.

A jelentősebb kiadók honlapján regisztrálva egy ingyenes e-mail szolgáltatáshoz is hozzájuthatunk, mely rendszeresen elküldi számunkra a frissen megjelenő folyóiratok tartalomjegyzékét   »1.6.  

 
1.3. FTP, fájlok másolása

Az e-mail kiváló lehetőség az üzenetek továbbítására, de a különböző fájlok küldésénél megvannak a korlátai. Megabyte nagyságrendű dokumentumok továbbítása már problémákat okozhat. Ha a küldés sikerül is, nagy az esélye annak, hogy a továbbító szerverek vagy a fogadó számítógép nem tudja a túl nagy fájlt megfelelően kezelni. Természetesen a fejlődés ezeket a határokat is kitolja. Tíz évvel ezelőtt még 100 — 200 KB volt a javasolt maximális méret.
 
Van egy egyszerűbb és sokkal hatásosabb módszer a dokumentumok továbbítására. Ez az ún. FTP (file transfer protocol  = fájlküldési eljárás). Az FTP használatakor a fogadó és a küldő számítógép között direkt kapcsolat létesül, és ez végig fennáll a küldés ideje alatt. A kapcsolat létrehozásához általában szükséges, hogy a felhasználónak bejelentkezési joga (username, password) legyen az adatátvitelben részt vevő mindkét egységen. Ennek a szigorú feltételnek a feloldására vezették be az anonim FTP lehetőségét, melynél a felhasználó a bejelentkezéskor névként (username) az anonymous szót adja meg és kulcsszóként (password) — ha kérik — a saját e-mail címét gépeli be. 

A sikeres bejelentkezés után lehetőség van a távoli számítógép nyilvánossá tett részén (public domain) ugyanúgy "mozogni" a látható alkönyvtárak között, mint a saját gépünkön, és "letölthetünk" (transfer) bármely dokumentumot, programot, melyre szükségünk van.

Az egér segítségével végezhetjük el a megfelelő műveleteket, ha "böngészőprogramok" ( » 1.4. ) révén teremtettük meg a kapcsolatot vagy gépünkön olyan FTP-program fut, amely grafikus felhasználói környezetet ( graphical user interface, GUI ) biztosít. A böngésző programok használata esetén a cím mindíg az ftp:// karaktersorral  kezdődik, ami azt jelzi, hogy FTP-hellyel kívánunk kapcsolatot létesíteni. A xxx nincs. táblázat külön tartalmazza néhány fontosabb FTP-hely címét, de a többi táblázatban megadott címek alatt is találhatók letölthető programok, dokumentumok.

Ha nincs lehetőségünk a GUI használatára, akkor a kapcsolat megteremtése, megszüntetése és a fájlok másolása parancsszavak segítségével irányítható. Ezek használatát későbbi fejezetek ismertetik » 3.1. FTP-program; 3.4. ftp

 
1.4.  A World Wide Web

A legfejlettebb internet eszköz, a WWW (World Wide Web vagy világháló) már nemcsak szöveges dokumentumokat közvetít, hanem képet, zenét és videofilmet is. Az un. böngésző- (browser) programok használatakor (Netscape Navigator, Internet Explorer, AOL) az egér segítségével speciális szövegrészekre, gombokra, képekre (link, ugrópont) kattintva haladhatunk tovább a bennünket érdeklő információt tartalmazó oldalak felé. Olvashatunk folyóiratokat, nézhetünk képeket, vásárolhatunk, ellenôrizhetjük a bankszámlánkat, részt vehetünk tanfolyamokon.

A lehetőségek a biológia területén belül is rohamosan bővülnek és — amint látni fogjuk a következő fejezetekben — jelentős eszközöket adnak a kutatók, oktatók, a tanulni vágyók kezébe. Ma már megszámlálhatatlan honlap létezik, melyekre példákat az 1.táblázat tartalmaz. Minden jelentős kutatóintézet, egyetem, múzeum folyamatosan frissített oldalakkal segíti a jobb és gyorsabb tájékozódást. Az információbőség hátránya, hogy sokszor nehéz a bennünket érdeklő oldalakat, helyeket megtalálni. Ráadásul eltévedhetünk "szörfölés" közben, hiszen egy egyszerû kattintás után sokszor a Föld ellentétes oldalán lévő szervernél találjuk magunkat. A hálózat túlterheltsége és saját böngészőprogramunk esetleges elavultsága szintén sokszor jelentkező hátrány, mivel hosszú perceket vehet igénybe a bonyolultabb felépítésű oldalak megjelenése.

A honlapokon belül és azok között a navigálást a “hiperlinkek” teszik roppant egyszerűvé. A pontos címeket nem kell ismernünk, ezeket az oldal készítői “programozzák” bele a szövegbe. Természetesen a böngészőprogramok címmezőjébe direkt is beírhatjuk az elérni kívánt helyet. Ezeket a címeket hívják URL-nek (uniform resource locator). A böngészőprogramok nemcsak web-helyeket, hanem FTP- és gopher-helyeket is képesek kezelni. Ezért a cím első fele mindíg a hely fajtáját adja meg ( ftp://  vagy gopher: //  vagy http:// )  A http:// a web címben a "hypertext transfer protocol" elnevezésből ered.

Tehát különböző böngészőprogramokat használunk a web-helyek oldalainak megtekintésére. Ezek a programok értelmezik azt a kódot, amellyel a web-oldalak íródtak (hypertext markup language vagy HTML) és a megfelelő formában jelenítik meg azokat, függetlenül attól, hogy PC, Macintosh vagy UNIX rendszert használunk. A két legnépszerűbb böngészőprogram a Netscape Navigator és az Internet Explorer. A legfejlettebb változatok már több felhasználó levelezését, internet címlistáját (bookmarks vagy favorites) és beállításait képesek külön kezelni, valamint kiegészülnek egy honlap szerkesztésére alkalmas programmal is. Ilyen a Netscape Composer vagy a Microsoft FrontPage, melyek használata nagyon hasonló egy szövegszerkesztő programéhoz. Kis gyakorlás után bárki képes vele egyszerűbb honlapokat készíteni, nem kell ismernie a HTML szabályait.

 
1.5. Keresôprogramok

   Ha egyáltalán nem tudjuk, hogy hol található a számunkra érdekes információ, akkor használhatjuk a különböző kereső vagy böngésző honlapokat, melyeken kulcsszavak megadásával, illetve témakörök kiválasztásával végezhetjük a keresést. Témák szerint kereshetünk virtuális könyvtárakban is » 1.táblázat .

   A National Library of Medicine ( NLM ) térítésmentes szolgáltatása a PubMed, mely több mint 11 millió tudományos cikk adatai közötti keresést tesz lehetővé, az Internet Grateful Med hasonló szolgáltatással együtt. A PubMed rendszeren keresztül elérhetők és kereshetők a DNS-, fehérje- és 3D-adatbázisok is, míg az Internet Grateful Med hozzáférést biztosít többek között az AIDS, bioetikai, orvostörténeti, toxikológiai, klinikai és vegyület-adatbázisokhoz is » 1.táblázat .

Az internet adta új és eddig nem látott lehetőségeinek egyik meggyőző példája az ENTREZ- ( antré ) rendszer » 2.2.

Ebben a rendszerben egyesülnek  a DNS- és fehérjeadatbázisok valamint a szekvenciaadatokhoz tartozó tudományos publikációk egy kulcsszavakkal kereshetô rendszerré, ahol hivatkozásról DNS- vagy fehérjeszekvenciákra, rokon témájú publikációk tömegére bukkanhatunk egyszerű kattintásokkal. Természetesen a hatékony használat előfeltétele itt is — mint minden más estben — a megfelelő teljesítményű hardver és a nagy kapacitású hálózat.

 

 
1.6. Elektronikus folyóiratok

 Ma már az internetnek és a webnek meghatározó szerepe van a tudományos kommunikációban. E könyv minden fejezete bizonyítja ezt. Bár a klasszikus könyvtár használatának és a nyomtatott információnak megvan a maga egyéni íze és jelentősége, nem lehet figyelmen kívül hagyni a világháló lehetőségeit.

A jelentős tudományos folyóiratoknak és kiadóiknak már mind megvan a maguk honlapja. A 2. táblázatban néhány példa látható erre. A legtöbb folyóirat esetén a tartalom és az összefoglaló szabadon megtekinthető, de a teljes terjedelmű cikkeket csak előfizetés esetén olvashatjuk el. Az elérhető folyóiratok száma, a szolgáltatás minősége gyorsan változik. Több folyóirat illetve kiadó ingyenes e-mail szolgáltatást vezetett be, és a regisztráltaknak elküldi a frissen megjelenő folyóiratok tartalomjegyzékét.

Megjelentek az első, csak online folyóiratok is, melyekbe a publikáció beküldése is elektronikusan, az intermeten keresztül történik. A közlésre elfogadott publikációk bárki számára ingyenesen hozzáférhetők, letölthetők (BioMed Central, BMC folyóiratok  »  2. táblázat ).


Az internet előnye — a gyorsaság és a kényelem mellett — hamarosan abban is megmutatkozik majd, hogy nagy terjedelmű kiegészítő anyagot kapcsolhatunk a közleményekhez, frissíthetjük, esetleg utólag kiegészíthetjük a publikációkat és hanganyag, videofilm is csatolható hozzájuk. Ezek a lehetőségek egy hagyományos publikálásnál aligha állnak rendelkezésre. Ráadásul a szövegbe "linkeket" építve, lényegesen könnyebbé válik a hivatkozások, módszerleírások elérése. Saját számítógépünkön keresztül sokkal gyorsabban és könnyebben juthatunk a keresett információkhoz, mint bármely, jól felszerelt könyvtárban. Sajnos, ennek ára az egyre több, monitor előtt töltött óra.  kezdőlap  -       BIOinformatika       - kezdőlap