|
|
Expertensysteme auf der Basis von (X)HTML, CSS, Java und JavasriptDefinition von Finexs und Senexs von Ralf Köchert | |
|
|
|
Ein Hypertextvorwort?Schon in Büchern werden die Vorworte in der Regel nicht gelesen. Im Hypertext gibt es kein Vorwort mehr. Denn wo ist "vor" oder "nach" dem Hypertext? Seit über zwanzig Jahren beschäftige ich mich mit der Thematik der elektronischen Datenverarbeitung, mal als Hauptschauplatz, mal als Nebenschauplatz, sowohl beruflich als auch privat. Dieser Artikel ist eine Zusammenfassung von diversen Passagen und Puzzleteilen von dem, was ich so in den letzten Jahren "zu Chip, Platte und Schirm" und nicht zuletzt, auf Umwegen dann auch zu Papier gebracht habe. Falls das Lesen dieses Artikels bei jemanden die Neugier nach "Mehr" zu diesem Thema ausgelöst hat, kann er vielleicht in meinem Buch: "Expertensysteme im Hypertextzeitalter" fündig werden. Hypertext ist eine neue Möglichkeit, sich Wissen, Informationen und Daten zugänglich zu machen. Das ist unermesslich viel an sich, aber auch nicht mehr. An Hypertext begeistert mich, dass der Leser, dieses Artikels, die Möglichkeit hat, so er diese Information will, in weniger als sieben Klicks zu erfahren, dass Stephen Hawking 300 Jahre nach dem Tod von Galileo Galilei geboren wurde oder, so er das wünscht, sich ein Bild von Sandra Bullock aus dem Film "While You Were Sleeping (1995)" betrachten kann. Maximal Sieben Klicks von jedem Initiallink im Text der Inhaltsseiten aus, bis zur gewünschten Information, wenn diese Information im Expertensystem und den angebundenen Datenservern vorhanden ist, und dies, ohne Verwendung der Suchmaschine, das war eine meiner selbstgestellten Zielvorgaben für das hier skizzierte Expertensystem. Expertensysteme - ein wenig GeschichteExpertensysteme und Experten Expertensysteme gibt es eigentlich schon seit es "Experten" gibt. Dabei verkörpert jeder Mensch im Grunde einen Experten, mit seiner ihm eigenen unverwechselbaren aus den Erfahrungen, Intuitionen und/oder logischen Folgeschlüssen entstandenen Wissensstruktur. Entlang der in diesem Artikel noch näher erläuterten "Intelligentes Elektronisches Datenverarbeitungssytem" zu bringen, fortan zunehmend Expertensystem genannt. Der technische Durchbruch gelang jedoch erst später. Die 5. Computer-Generation brachte den Siegeszug der Expertensysteme mit sich. Das Schlagwort der 5. Generation war zunächst durch ein ziviles staatliches Forschungs- und Entwicklungsprogramm der japanischen Regierung geprägt. Dabei handelte es sich in erster Linie um sogenannte "intelligente" Software. Beispiele waren neuartige Expertensysteme und Roboter mit "künstlicher Intelligenz", die komplexere Funktionen übernahmen, wie z.B. Schweißroboter. Im Gegensatz dazu waren die amerikanischen Bestrebungen militärisch geprägt. 1983 wurde ein 10-jähriges Programm gestartet. Die Grundidee war: Maschinen mit menschenähnlichen Fähigkeiten zu entwickeln, die in atomar und chemisch verseuchtem Gebiet operieren können. (Hug, K.-H. [1984]: Strategic Computing Initiative. Informationsdienst Wissenschaft und Frieden; herausgegeben vom Bund demokratischer Wissenschaftler e.V., Marburg, Heft 3/84) Geplant waren unbemannte Fahrzeuge, die sich ihren Weg selbst mit Hilfe visueller Sensoren suchen, automatische Co-Piloten, die menschliche Sprache verstehen, ein Expertensystem, das den Kommandeuren der amerikanischen Streitkräfte Vorschläge zur Kriegsstrategie unterbreiten und sie vor anstehenden Problemen warnen sollte. Parallel zu den in der Praxis wirksamen Formen der Expertensysteme entwickelte sich eine ganze Philosophie und Technik um den Begriff der Künstlichen Intelligenz (engl. Artificial Intelligence). Die Euphorie der 80´ger Jahre ist längst wieder abgeklungen, um wie viele Wunschträume nach Perfektion und Vollkommenheit hin und wieder erneut aufzuflackern. Den militärischen und besseren zivilen Führungskräften ist wieder bewusst geworden und heute bewusst, dass man vom Daten - Informationen - WissenWill man nun Wissen abbilden und als ein Expertensystem realisieren, wie ich es als sinnvoll und praxisrelevant verstehe, ist die Art der Abbildung und Auszeichnung in Form des Internets zwingend und genial zugleich.
Zu Beginn einige Alttagssituationen, wie ich sie in vielen produzierenden Unternehmen weltweit erlebt habe: Fall eins - Ausgehend von einem Qualitätsproblem in der Fertigung oder einer schwerwiegenden Reklamation am Markt ergibt sich eine technische Fragestellung deren Beantwortung für das weitere Vorgehen grundlegend notwendig ist. Das vorhandene Wissen, falls nicht vorhanden, Informationen, falls ebenfalls nicht vorhanden, wenigstens Daten zum Thema, werden umgehend als Entscheidungsgrundlage benötigt. Fall zwei - Eine Produktentwicklung beginnt. Eine Übersicht bisheriger, für genau diese am Markt interessante Produktspezifik, relevanter Informationen muss zur Entscheidungsfindung zusammengestellt werden. Fall drei - Zum Vergleich neuer Daten einer Entwicklungsreihe werden Daten vergangener Versuche benötigt. Fall vier - Für die Vorbereitung einer Nullserie oder Serie werden diverse technische Dokumentationen benötigt, die mit den Marketingzieldaten und den vorhandenen Entwicklungsergebnissen zu vergleichen sind. Die ErkenntnisketteAllen vier Fällen ist zunächst eins gemeinsam, entlang der Kette: Daten - Information - Wissen werden auf dem Weg des Erkenntnisgewinns durch Selektion Teile der Daten und Informationen gelöscht oder "versteckt". Die Quintessenz: "Der Prototyp wird freigegeben!", ist auf der Basis einer Vielzahl auch eben dieser "versteckten" Informationen und Daten, zum Teil durch stillschweigende Vereinbarungen gewollt, zum Teil durch absichtliches "Weglassen", entstanden. Wird eine Entscheidung, ein Wissensbestandteil erneut hinterfragt, müssen diese Informationen, Daten oft neu erarbeitet werden, um den Wissensschluss neu zu vollziehen. Eine weitere Gemeinsamkeit: entlang der Kette treten stets Verluste auf, die mindestens zeitlich relevant, wenn nicht sogar permanent und vollständig sind. Geschieht dies zunächst ausschließlich durch die bereits genannte Selektion anhand statischer und dynamischer Kriterien und durch Vergabe von Prioritäten, erfolgt gleichzeitig und permanent zusätzlich ein individuell unterschiedlicher Verlust durch die Zeit. Hier sind auch die Veränderung von Zitaten, eins meiner Lieblingsbeispiele: dass mit der Zeit stark veränderte Sokrateszitat oder die mit der Zeit völlig gewandelte Wortbedeutung des Wortes Porzellan. Der Mensch vergisst einfach oder schlimmer noch für die Verlustrate, der Experte scheidet aus dem Unternehmen aus. Und noch eine wichtige Gemeinsamkeit: Wissen ist als Ergebnis der Erkenntniskette an den jeweiligen Experten gebunden. Experte A weiß nicht notwendig was Experte B weiß. Und, gar nicht so spaßig, wie das zunächst klingt, und aus der Praxis bekannt, Experte A und B sind, nicht nur nach Mc Murphy, wenn es darauf ankommt, gar nicht da! Und schließlich, Experte C will erst noch einer werden, er weiß noch nicht einmal, wer schon Experte ist und wen man fragen kann. Die marktschreierische Behauptung, diese Verluste durch "intelligente" Datenbank- und Content Management Systeme ausschließen zu können, kann der erfahrene "Wissensverwalter" nur mit zum Erstaunen gehobenen Augenbrauen zur Kenntnis nehmen. Diese Versprechungen erinnern mich an "Das Lied von der Unzulänglichkeit des menschlichen Strebens" aus der Dreigroschenoper (Bertold Brecht, Ausgewählte Werke in sechs Bänden, Suhrkamp Verlag, Frankfurt am Main, 1997, S. 253; auf das Zitat verzichte ich aus schutzrechtlichen Gründen). Die Denkweise des Menschen, die kognitive, assoziative Struktur seines durch Selektion entstandenen Wissens ist eben gerade nicht an vorgegebene, einfache Strukturen, wie z.B. ein Telefonbuch, ein Postleitzahlverzeichnis oder eine ISO zu koppeln. Daten kann man in Tabellen sammeln, Informationen in einen Ordner sortieren, Wissen nicht. Hier setzt die Idee der Expertensysteme an. Suchen - Finden - WissenWissen, Informationen und Daten zu finden, den Verlauf der Erkenntniskette nachzuvollziehen, das ist die eigentliche Aufgabenstellung die den o.g. vier Fällen zugrunde liegt. Expertensysteme können helfen, dies zu bewältigen. Wissen ist komplexer als Informationen, letztere sind komplexer als Daten. Gesucht war eine elektronische Abbildung, die alle drei Stufen des Erkenntnisgewinns möglichst intelligent zur Verfügung stellt. Angesichts der heute in jedem innovativen Unternehmen verfügbaren Rechner-Netzwerke, ist die Realisierung durch ein webbasiertes Expertensystem naheliegend. Der, nach meinem Kenntnisstand, in der Regel bisher nur theoretisch diskutierte Anspruch eines kreativ arbeitenden Expertensystems wird in diesem Artikel nicht weiter verfolgt. Ich halte es gegenwärtig nicht für möglich, besser noch nicht vorstellbar, ein hochspezialisiertes Team von Technikern, Ingenieuren und Wissenschaftlern, auch nur ansatzweise zu ersetzen. Zwanzig Jahre Erfahrung im Umgang mit Rechnern und Rechnersystemen an der Universität, privat und im Bereich Forschung und Entwicklung eines großen deutschen, weltweit operierenden Unternehmens, lassen mich die Visionen solcher Systeme mit äußerster Skepsis, ja bisweilen sogar mit Argwohn betrachten. Die notwendigen Assoziations- und Selektionsabfolgen der Erkenntniskette mit den Mitteln des HTML abzubilden, erwies sich als eine realisierbare, kostengünstige Lösung zur Minimierung des zeitlichen und fachlichen Informationsdefizits in den o.g. Fallbeispielen. Die tatsächliche Leistungsfähigkeit reicht selbstverständlich weit darüber hinaus. Nicht nur SUCHEN, sondern FINDEN, LEITEN und damit WISSEN und dann ENTSCHEIDEN - ist das Ziel eines Expertensystems. Insofern ist ein Expertensystem ein Instrument, das durch abgebildete Schlussfolgerungsmechanismen und kognitive Strukturen der Experten, sich gegenüber dem Suchenden ähnlich wie ein menschlicher Experte "verhält", und entspricht damit mindestens in diesem Punkt den theoretischen Ansprüchen an Expertensysteme. Finexs* und Senexs®*Definition des Expertensystems erster Art, Finexs: Unter einem Finexs verstehe ich ein System, das Wissens- und Erkenntnisstrukturen auf der Basis des Hypertextes oder ähnlicher Text- und Datenverarbeitungssysteme durch audio- und/oder visuelle, sonstige sensorische, elektronische oder manuelle Eingabe abbildet. Durch intelligentes Verlinken sowie gezieltes Beeinflussen, einer auf Indizierung des Basisinhalts beruhenden Suchmaschine oder eines irgendwie gearteten Such-Roboters wird die Umkehrung der Erkenntniskette für den Nutzer sukzessive vollständig ermöglicht. Auf der Basis von Aufzeichnung und Auswertung der Interaktion Nutzer-Suchmaschine-Netzwerk, kann Selektion, Generalisierung und Abstraktion in Form eines neuronalen Netzes realisiert werden. Dies geschieht beispielsweise durch die deskriptive und prädiktive statistische Aufarbeitung der Server-Log-Dateien auf der Basis einer ins System integrierten Analysesoftware und der darauf beruhende Beeinflussung des Suchmaschinen-Ranking während des Kreisprozesses: Suche-Ergebnis-Weitersuche-Ergebnis-Suche. Des weiteren wird auf der Basis der eben genannten Auswertungen, bei durch den programmierenden Experten vorgegebenen Generalisierungsstrukturen, eine automatisierte Querverlinkung von Metaphern möglich. Definition des Expertensystems zweiter Art, Senexs®: Ein Senexs unterscheidet sich von einem Finexs, durch zusätzlich vorhandene, selbstbasierte Kreativität und Lernfähigkeit. Gemeint ist, dass durch dieses System aus zwei bis endlich vielen vorhandenen Daten, Informationen, Erkenntnissen eine qualitativ neue Erkenntnis ausschließlich durch das System selbst produziert wird. Praktisch relevante Beispiele, die über eine in das System programmierte "Zufallskreativität" hinausgehen, sind mir Stand heute nicht bekannt. Mit "praxisrelevant", ist hier ausdrücklich kein System gemeint, das mit eins bis n vielen "eingebauten menschlichen Experten" durch eben diese praktisch selbst betrieben und in seiner neuronalen Struktur weiterentwickelt wird. *Finexs und Senexs® sind angemeldete Marken. Suchmuster - mindestens dreiDie moderne Rechner- und Netzwerktechnik hat eine Unmenge von Daten und Informationen verfügbar gemacht. Die Bibliothek auf dem Schreibtisch ist Realität geworden. Um kreativ zu werden, um Entscheidungen zu treffen, verschafft man sich Informationen in vergleichsweise kurzer Zeit von weltweit zur Verfügung stehenden Ressourcen. Dieser unstrukturierten Datenmenge wurde nun für das interessierende Gebiet ein Expertensystem "aufgesetzt". Dabei beschränkt sich der Datenabgriff auf sehr spezifische, firmeninterne Daten. Trotzdem beträgt die insgesamt anfallende Datenmenge im infrage kommenden Bereich schätzungsweise einige 10 Gbyte jährlich. Das vielzitierte Gefühl des
Bei der Realisierung des Projektes wurde von drei Suchertypen ausgegangen, da die Vorgehensweise eines Nutzers beim Suchen in Expertensystemen auf Web-Basis (im übrigen auch im Internet) durch diese drei Typen, mehr oder weniger gemischt, sehr gut repräsentiert wird. Typ A, der "Baumtyp": Er findet sich gut über Inhaltsverzeichnisse zurecht und liest die Texte linear, dazu braucht man zunächst nicht unbedingt elektronischen Hypertext. Durch ein Web hangelt sich dieser Suchertyp ähnlich, wie durch eine Bibliothek, statt durch Karteikästen und Regale jetzt über Links durch die Navigationsebenen. Mit den Mitteln des Hypertext kann er über ein gut durchdachtes Menü- und Navigationsdesign zum Sucherfolg, zur Erkenntnis geführt werden. Wer noch nicht viel über ein Fachgebiet weiß, sucht in der Regel auf diese Weise. Er kennt die Begriffe noch nicht, die ja selbst schon in hohem Maße selektiertes, assoziiertes und damit "kondensiertes" Wissen verkörpern. Typ B, der "Metaphertyp": Er bevorzugt das diagonale Lesen, um im Fall eines interessanten Begriffes, einer Metapher deren Hintergrund, Ursprung und/oder Bedeutung zu erfragen. Von Metapher wird hier gesprochen, weil sich eben beispielsweise hinter dem Begriff Strahlung, eine ganze Wissenschaft verbirgt. An dieser Stelle zeigt sich die neue Qualität des Hypertextes im Vergleich zum klassischen Text. Ein Begriff, eine Metapher im Text ist "verlinkt"! Wenn seine, ihre Bedeutung nicht bekannt ist, ist im klassischen Text ein weiteres Buch, ein Wörterbuch, ein Lexikon oder gar die Befragung eben eines Experten erforderlich. Bei Hypertext ist das alles nicht notwendig. Es wird auf den Hyperlink "geklickt", die zusätzliche Information ist vorhanden und sofort verfügbar. Welche Informationen verfügbar sind, entscheidet der Autor, der Experte. Der Experte determiniert die verfügbaren Querlinks, den hinterlegten Inhalt und die Informations- und Datentiefe. Er bestimmt damit schlussendlich, grundlegend den Verlauf der Typ C, der "abstrakte Typ": Dieser Suchtyp hat bereits ein hohes Maß an eigenem Expertenwissen. Er benutzt mindestens zu Beginn seiner Recherche fast ausschließlich die Suchmaschine. Hier setzt das Expertensystem und der Hypertext in seiner ganzen Stärke an. Wie im Abschnitt Ausgangssituation des skizzierten ProjektesBeginnend in den 80'ger Jahren wurden auch in der Industrie zunehmend Personalcomputer eingesetzt. Später, in den 90'ger Jahren, wurde dann der PC an jedem Arbeitsplatz in vielen Bereichen Realität. Am Beginn des neuen Jahrtausends, ist im Allgemeinen die totale Vernetzung dieser PCs weltweit innerhalb eines entsprechend platzierten Unternehmens Standard. Dies ist eine wichtige technische Voraussetzung für den Start eines Projektes in der Art, des hier skizzierten Expertensystems. Unausweichlich kam es in den letzten Jahren parallel zu dieser "Computerisierung des Arbeitsalltags" zu einer Erscheinung, die ich allgemein als die Inflation der Information bezeichnen will. Der "vernetzte PC-Nutzer" wird mit Daten und Informationen überschüttet, zugeschüttet. Die Erkenntnisstufe des Wissens wird durch diese Vielfalt nicht notwendig einfacher und schneller erreicht. Information und Synergie können sogar ins Gegenteil umschlagen. Der Aufwand für Selektion und Assoziation, den ein Nutzer der neuen Medien investieren muss, um das Wesentliche als Wissen abbilden und Entscheidungen fällen zu können, übersteigt schnell und unerwartet den Nutzen der allgemeinen Vernetzung. Ein praxisnahes Beispiel, das den Zustand veranschaulicht: Nehmen wir einmal an, in irgendeinem Bereich eines Unternehmens arbeiten 1000 Techniker, Ingenieure und Wissenschaftler. Jeder von ihnen produziert am Tag etwa 50 A4-Seiten an Schriftstücken und Messdaten (dass ist nicht viel). Das macht im Jahr bei gut 180 Arbeitstagen 9.000.000 Seiten Information, in 10 Jahren schon 90.000.000, ein überproportionales Wachstum nicht eingeschlossen. In Wahrheit sind es vielleicht mehr oder weniger Daten und Informationen, aber spinnen wir den Faden weiter. Würden von jeder dieser Seiten 10 Hyperlinks zu irgend einer beliebigen anderen Seite führen, dann wären wir schon bei 900 Millionen Hyperlinks. Zum besseren Vergleich, die besten Suchmaschinen indizieren zur Zeit etwas mehr als eine Milliarde URLs! Für ein Unternehmen ist es heute daher unabdingbar diese Inflation der Information zu verhindern. Verschiedenste Systeme des Datenbank-, Server- und Content Managements setzen hier an und sind eine weitere Voraussetzung, die im Falle dieses Projektes gegeben war. Hier wird das Expertensystem aufgesetzt. Es bildet die Ergebnisse von Selektion und Assoziation, das Expertenwissen, strukturiert ab und ermöglicht gleichzeitig die Rückverfolgung der Ausgehend von diesen Voraussetzungen basiert das beschriebene Expertensystem im Wesentlichen auf drei Säulen:
Überschaubarkeit - Säule IDiese Säule I ist Herz und Hirn des Expertensystems und lebt vom Hypertext und damit von HTML. Nach den vorangegangenen Abschnitten ist offensichtlich: der Dreh- und Angelpunkt des Expertensystems ist die Überschaubarkeit. Hier gilt, wie so oft, weniger ist oft mehr. Die wesentlichen Einstiegspunkte in die abgebildete Wissensstruktur müssen schon auf der Portalseite angeboten werden. Diese Seite ist vor allem für den Anfänger und den Das ist eine ähnliche Struktur, wie sie der Leser auch von SELFHTML kennt (Warum immer wieder ein Das Gegenbeispiel kennt jeder aus dem Internet. Manchmal ist Navigationsleistenterror nicht zu vermeiden, oder doch? Anschauliche Beispiele für unübersichtliche Seiten sind die Portalseiten der Regierung von G. W. Bush Ein Expertensystem ist dazu im Gegenteil eben nicht als reine Informations- und Datensammlung zu verstehen, ist kein reines Nachschlagwerk oder Lexikon, keine online-Zeitschrift! Es ist so angelegt, dass es leitet, Übersicht gibt, schlussendlich Wissensstruktur und zusätzlich falls gewünscht und notwendig, Informationen und Daten vermittelt. Ein Grundanspruch des Expertensystems ist also, wie ich es nenne, die kognitive Ergonomie. Realisierung mit HTML und CoDas Web des Expertensystems selbst, ist (X)HTML in "reinster" Form. Jeder weiß, dass der Anspruch des fehlerfreien W3C-konformen (X)HTML nicht erfüllbar ist. Aber es gibt Unterschiede. Wie noch im Abschnitt Die Vorteile der Anwendung eines code-basierten Editors lassen sich an einem einfachen Vergleich veranschaulichen. Ausgezeichnet werden soll der Messwert-Angabe 6642 ± 86. In "reinem" (X)HTML sieht der Quelltext (CSS-Datei für die Festlegungen für <p></p> nicht vergessen) so aus: In MS-Word erzeugt und dann abgespeichert als html-Datei wird daraus der Quelltext: Die dynamischen Komponenten sind mit Hilfe von Javascript realisiert. Die wichtigste Prämisse war hier, wie beim ganzen Projekt, Einfachheit. Diverse Scripts sind Variationen von Scripts, die mir bei meinen jahrelangen "Spaziergängen" im Internet in "die Hände gefallen sind". Oft sind es Kleinigkeiten der Syntax, die weiterhelfen und in ihrere Schlichtheit genial sind. Viele Scripts (nicht nur Spielereien) findet man bei Dem Schrift- und Hyperlinkbild und Tabellenlayout liegt eine CSS-Datei zugrunde. Als ganz guter Einstieg in dieses Gebiet erweist sich Die im nachfolgenden Beispiel gezeigten Zellendefinitionen dienen dem farblichen Gesamtdesign und der Ergonomie des Expertensystems im skizzierten Fall. Ähnliches findet man vielfach im Internet vor. Diese Farbgebung für die farblich angepassten Informationstabellen wichtig. Zur Erläuterung: ein Link in einer "Zusammenfassungszelle" führt auf die "Zusammenfassungsseite" in identischer Farbe, in diesem Fall "türkis"; Hexcode: Beispiel: Auszug aus der CSS-Datei, Tabellenzellen-Definition
Beispiel: Auszug aus einer Tabelle, Klassenzuweisung für Tabellenzellen
Die Zelle mit der Zusammenfassung ist hervorgehoben, zur Veranschaulichung: Anbindung von Informationen und Zugriff auf Daten - Säule IIIn den Ebenen unterhalb der Portalseite finden sich auch Seiten mit einer Tabelle von Hyperlinks zu verschiedenen Informationsbereichen, wie wir sie ähnlich auch bei SELFHTML finden, ein anschauliches Beispiel, das Die Daten und Dokumente sind auf einem weiteren, vom Web-Server unabhängigen Server abgelegt. Dort werden die Ergebnisse/Daten/Dokumente in den von den Nutzern auf ihren Arbeitsplatz-PCs verwendeten Formaten gespeichert. Der Zugriff auf die Dateien erfolgt über Hyperlink-Filereferenz entsprechend des jeweiligen MIME-Typs. Code-Beispiel für den Link auf die Originaldatei (Achtung! Datei verursacht Öffnung von word.)
zur Originaldatei (doc) (Die Spannung liegt hierbei darin, wie sich das Fenster beim Klick auf die Originaldatei öffnet.) Hier bin ich stand heute, zu keiner befriedigenden Lösung gekommen, was die gezielte Öffnung der Datei in einem definierten Fenster anbetrifft. Gewollt wäre in 90% der Fälle der Fall 1, aber alle "Ermittlungsversuche" führen immer wieder, und das, nicht reproduzierbar, zu allen drei nachfolgend kurz skizzierten Fällen .
Ich kann rückblickend nicht mehr abschätzen, wie viel Arbeit ich in diesen Punkt bereits gesteckt habe. Auch eine Anfrage im Die Suchmaschine - Säule IIIDiese Suchmaschine basiert auf dem Originalprogramm ht://Dig © der Diese Säule III des Expertensystems ist entscheidend für die Effektivität desselben. Jeder kennt das leidige Problem: beim Suchen findet man oft den Wald vor lauter Bäumen nicht. Wer beispielsweise einmal die Strings Folgende vier Punkte sind für die Effektivität der Suchmaschine grundlegend wichtig:
1. Die Liste der SynonymeHier ist der Experte gefragt. Er entscheidet, welche Begriffe zur Metapher werden und welche Synonyme zu einer zu dieser Metapher zugeordneten Gruppe werden. Grundsätzlich gilt, was gefunden wird, beeinflusst wiederum der Experte. So lenkt er zum Beispiel über Synonyme der Begriffe und die damit verbundenen Metaphern, den Suchenden, was für diesen meist unbemerkt bleibt. Dies ist einer der wesentlichen Unterschiede eines web-basierten Expertensystems zum Internet. So ist der gesuchte Begriff NaCl über das Synonym Natriumchlorid mit den Metaphern Natrium und Natriumchlorid verbunden, die Ausgangspunkt, von n weiteren Links zu Informationen, Daten sind. Wer NaCl sucht, landet schnell bei der Wellenlänge der Resonanzlinie des Natriums. In diesem Fall ist er nach der Eingabe in die Suchmaske noch genau zwei Links von dieser "vielleicht" nicht gesuchten aber doch wichtigen Information entfernt. Wichtig, weil für das Aufgabengebiet wichtig, eine Wichtung, die der programmierende Experte in das Expertensystem "hineingesteckt" hat. 2. Die Liste der bad wordsAuch hier gilt, der Experte legt zu Gunsten der Effizienz des Such- und Indizierungsvorganges fest, was nicht indiziert und damit nicht gefunden wird. Diese Liste umfasst sehr schnell zwischen 500 und 1000 Worte, wobei offensichtlich ist, dass nicht allein die häufige Wiederholung eines Wortes im zu indizierenden Text die Nichtindizierung des Wortes determiniert. Sind in einem Fall die Worte: Daten, Datum, Ort, größten usw. nicht relevant, kann das gegebenenfalls genau anders herum sein. Mit Hilfe dieser Datei kann der Umfang der root_to_word-Datenbank stark reduziert werden. 3. Die Liste der nicht zu indizierenden DateienHier treffen die Bemerkungen unter Punkt 2. natürlich noch wirksamer zu. 4. Die Aktualisierungsfrequenz der IndexdateiFür diesen Punkt gibt es meiner Meinung nach einfach kein Rezept. Eine tägliche Indizierung außerhalb der Normalarbeitszeit erscheint zwar, falls es keinen Zeitkonflikt gibt, sinnvoll, im speziellen Fall reicht jedoch zum Beispiel einmal wöchentlich aus. Sicher ist in der Luftfahrt, Medizin und ähnlichen Bereichen möglichst eine "Echtzeit"-Verfügbarkeit von Daten angebracht, aber in vielen anderen Bereichen ist das Streben nach dem ständig neuesten Stand wohl eher Wichtigtuerei. Fazit:Der EXPERTE auf dem FACHGEBIET des EXPERTENSYTEMS ist unverzichtbar für Aufbau und Support der SUCHMASCHINE des EXPERTENSYTEMS. Das Babylon der Software"...laßt uns eine Stadt und einen Turm bauen, des Spitze bis an den Himmel reiche, daß wir uns einen Namen machen! denn wir werden sonst zerstreut in alle Länder." 1. Mose 11,4. Oft erinnert mich die Welt der Software an den in dieser Passage beschriebenen, sehr wahrscheinlich, tatsächlich erfolgten, Die Welt der Software lässt sich heute aus meiner Sicht in einem Satz zusammenfassen: Im Sinne von Wissen, wie ich es verstehe, ist es nicht möglich diese Welt zu beschreiben. Die Prämissen aber müssen sein: Einfachheit anstreben, und Vertrautes, Funktionsfähiges, wo immer möglich, beibehalten. Neues nur, wenn es eine Verbesserung bringt, nicht weil es neu und/oder anders ist. Die Art der Inflation, die diesem Problemfeld zugrunde liegt, hat Stefan Münz in seinem Artikel Dem gibt es nichts wirklich Neues hinzuzufügen. Verfalls- und HaltbarkeitsdatenWie bereits beschrieben, sind die Web-Seiten skizzierten Expertensystem in (X)HTML sowie Javascript und CSS (Cascading Stylesheets) geschrieben und entsprechen weitestgehend den W3C-Vereinbarungen Stand 08/2002. Daher besteht bei Verwendung der von den Nutzen überwiegend eingesetzten Browser IE 5.X aufwärts oder des Netscape 4.X aufwärts, eine nur minimal abweichende Nutzbarkeit. Auch andere Browser wie Opera oder Mozilla wurden getestet und brachten erwartungsgemäß keine Schwierigkeiten. Einige Punkte des Designs und der Tabellendarstellung weichen geringfügig ab. Daraus ergibt sich, dass die Anforderungen an die Hardware immer dann erfüllt sind, wenn auch die o.g. Browser auf dem jeweiligen Client-PC funktionsfähig installiert und konfiguriert sind. Es liegen desweiteren von WIN98 an aufwärts, inclusive Macintosh und Linux/Unix auch keine, auf dem zugrunde liegendem Web beruhenden, Beschränkungen durch das Betriebssystem vor. Ein elektronische Expertensystem ist dafür gedacht, Wissen dauerhaft abzubilden. Wie sich die Welt der Auszeichnungssprachen weiterentwickeln wird, weiß ich nicht vorherzusagen. Das Einfache, Schlichte aber Funktionsfähige hat Neuerungen, die keine wirkliche neue Qualität, keinen Fortschritt bedeuteten, bisher stets überstanden und überlebt. HTML, jetzt (X)HTML wurde schon tausende Male totgesagt. Ich glaube, es bestehen gute Chancen, dass ein in (X)HTML, Javascript und CSS ausgezeichnetes Web noch mindestens fünf, vielleicht zehn Jahre lesbar sein wird. Vielleicht übertrifft es ja sogar die gegenwärtige "Lebensdauer" von PACMAN, was zum Beispiel auf meinem privaten XP- und LINUX-PC nach über zwanzig Jahren auch heute noch läuft. |
|
|
|
|