Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Java Suchmaschine

Frage Entwicklung Java

Mitglied: Praktikantin

Praktikantin (Level 1) - Jetzt verbinden

09.10.2007 um 12:41 Uhr, 6166 Aufrufe

zum laufen bringen

Hallo zusammen,
ich habe 7 verschiedene Java codes die hier zu finden sind: http://rapidshare.com/files/61318562/ji.tar.gz
Ich habe diesen Code auf einer Homepage einer Universität gefunden und war mehr als begeistert, da ich selbst so etwas gesucht habe und es ist wirklich klasse so ein fertiges IR System zu finden. Man bekommt eine Idee wie das alles läuft (Theorie ist gut Praxis ist besser). Ich will es zum laufen bringen aber irgendwie schaffe ich es nicht. Der Code ist zu hoch für mich und ich bin mehr als verloren. Was das Programm eigentlich machen soll:

Die klassische Implementierung eines IR-Systems funktioniert so, dass man die
Dokumente liest, in Wörter zerhackt, die Wörter zählt, und das alles in sogenannten
invertierten Listen abspeichert. Die invertierte Liste zum Term ti
enthält eine Liste aller Dokumentnummern, in denen der Term vorkommt. Bei
gewichteter Indexierung steht bei jeder Dokumentnummer auch noch dabei, mit
welchem Gewicht der Term in diesem Dokument versehen ist.
Man braucht also diverse Datenstrukturen:
1. Das Wörterbuch (dictionary) ordnet jedem Term eine Nummer zu, der
Rest des Systems verwendet nur die Nummer. Außerdem werden hier weitere
globale Daten zu jedem Term gespeichert, wie beispielsweise die document frequency (Anzahl Dokumente, die diesen Term enthalten).
2. Die Dokumentliste ordnet jedem Dokument eine Nummer zu. Ferner
können dokumentspezi_sche Daten hier abgelegt werden, beispielsweise
die Dokumentlänge.
3. Das inverted file enthält die invertierten Listen zu jedem Term, die oben
schon beschrieben wurden.
Das System besteht dann aus zwei hauptsächlichen Komponenten:
1. Der Indexer liest die Dokumente und baut die o.g. Datenstrukturen auf.
2. Der query processor nimmt eine Anfrage entgegen und liest die o.g.
Datenstrukturen und berechnet das Anfrageergebnis.

Hier eine Link zu der ganzen Aufgabe: http://rapidshare.com/files/61318729/09.pdf
Ich will das Programm einfach zu laufen bringen und es für cacm.all Sammlung benutzen: http://rapidshare.com/files/59055129/cacm.tar.gz
Die Java Klassen sind: Dictionary (erstellt das Wörterbuch), DV (splittet die Dokumente und erstellt wahrscheinlich einen Index, Indexer.java, Query (für die Abfragen, das Arciv befindet sich auf das cacm Archiv (Querl.txt (oder so ähnlich)), Search (für die Suche) und Stemmer.java für das Stemming. Ich will euch bitten mir weiterzuhelfen… Ich weiß wirklich nicht mehr weiter und bis ich das alles von selbst löse dauert es eine Ewigkeit. Seht euch die Codes an und ändert alles was nötig ist damit es auf meinem PC läuft. Die cacm Datei befindet sich auf c:\cacm\cacm.all, der Index und das Dictionary sollen jeweils auf C:\Index und C:\dict gespeichert werden und wenn der code DV.java läuft und die Dokumente von cacm.all trennt sollen die auf c:\docs gespeichert werden . Der code befindet sich aud C:\ji. Ich weiß jetzt nicht mehr was noch benötigt wird. Es wäre toll wenn auf Search.java ein Eingabe Feld erscheint und wir dort unsere Frage stellen können… Muss ich außerdem ein Packet erstellen? Ich bin für jede Hilfe mehr als dankbar.

Viele liebe Grüße
Julia
Ähnliche Inhalte
Windows 7
Löschen der unerwünschten Suchmaschine "amisite" über Programmentfernung
gelöst Frage von wiedhalmWindows 72 Kommentare

Hallo Experten! Irgendwie habe ich mir "amisite" eingefangen, welche sich auf meinem Firefox eingenistet hat und welche auch mehreren ...

Java
Wie bekomme ich bei Java diese Zertifkatsmeldung weg. Ein Abacus Login verwendet Java , und dies bringt eine Java Warnmeldung
Frage von 116480Java10 Kommentare

Hallo, scheinbar nur , wenn man aus unserem Netz auf ein Abacus System zugreift, das Java fürs Login verwendet, ...

Java
Was ist ein "Href" im Java ?
gelöst Frage von rainergugusJava31 Kommentare

Hallo zusammen, wir haben eine Applikation ; Die hat den Aufruf JNLP . Nun heisst es "Java neu eine ...

Java
Java Installationsoptionen
gelöst Frage von joergJava3 Kommentare

Hallo zusammen, kann ich beim automatisierten Ausrollen von Java-Paketen ein Flag mit setzen, womit ich gleich die Sitelists bearbeiten ...

Neue Wissensbeiträge
Internet

EU-DSGVO: WHOIS soll weniger Informationen liefern

Information von sabines vor 8 StundenInternet3 Kommentare

Wegen der europäische Datenschutzgrundverordnung stehen die Prozesse um die Registierunf von Domains auf dem Prüfstand. Sollte die Forderungen umgesetzt ...

Verschlüsselung & Zertifikate

19 Jahre alter Angriff auf TLS funktioniert immer noch

Information von BassFishFox vor 15 StundenVerschlüsselung & Zertifikate1 Kommentar

Interessant zu lesen. Der Bleichenbacher-Angriff gilt unter Kryptographen als Klassiker, trotzdem funktioniert er oft noch. Wie wir herausgefunden haben, ...

Windows 10

Windows 10 Fall Creators Update - Neue Funktion Hyper-V Standardswitch kann ggf. Fehler bei Proxy Configs verursachen

Erfahrungsbericht von rzlbrnft vor 1 TagWindows 104 Kommentare

Hallo Kollegen, Da wir die Gefahr lieben, haben wir bei einigen Usern nun mittlerweile das Creators Update drauf. Einige ...

Sicherheit

TLS-Zertifikat und privater Schlüssel von Microsofts Dynamics 365 geleakt

Information von Penny.Cilin vor 1 TagSicherheit

Microsoft hat versehentlich das TLS-Zertifikat inklusive dem privaten Schlüssel seiner Business-Anwendung Dynamics 365 geleakt. TLS-Zertifikat und privater Schlüssel von ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
Von rj11 auf rj45
Frage von jensgebkenLAN, WAN, Wireless18 Kommentare

Hallo Gemeinschaft, könnt ihr mir vielleicht bei der anfertigung eines Kabels helfen - habe ein rj 11 stecker und ...

Netzwerkmanagement
Firefox Profieles im Roaming
gelöst Frage von Hendrik2586Netzwerkmanagement17 Kommentare

Hallo liebe Leute. :) Ich hab da ein kleines Problem, welches anscheinend nicht unbekannt ist. Wir nutzen hier in ...

Netzwerkmanagement
NAS über zwei weitere Ethernet Anschlüsse verbinden
gelöst Frage von Sibelius001Netzwerkmanagement17 Kommentare

Sorry - ich bin hier wahrscheinlich als kompetter IT Trottel unterwegs. Aber eventuell kann mir jemand ganz einfach helfen: ...

LAN, WAN, Wireless
Häufig Probleme beim Anmelden in WLAN
Frage von mabue88LAN, WAN, Wireless15 Kommentare

Hallo zusammen, in einem Netzwerk gibt es relativ häufig (1-2 mal pro Woche) Probleme mit der WLAN-Verbindung. Zunächst mal ...