markus-so
Goto Top

Artikel aus dem Internet archivieren

Hallo!

Wer kennt es nicht? Man findet liest einen interessanten Artikel im Internet, erinnert sich ewig später wieder daran, kann ihn aber nicht mehr finden. Oder der Artikel ist nicht mehr im Netz. Ich habe über Google Reader viele Blogs abonniert und kennzeichne die besonders lesenswerten Artikel immer mit einem Stern oder Tag, so dass ich sie wiederfinden kann. Jetzt möchte ich diese Artikel gerne aber auch offline archivieren können.

Im Idealfall würde das so aussehen: Durch ein Newsfeed werden Artikel mit einem bestimmten Tag oder Markierte Artikel ausgelesen (stellt der Google Reader zur Verfügung) und in einer Datenbank (Felder: Autor, Text, Datum etc, was das Feed eben so hergibt) abgespeichert. Vorher wird geprüft, ob der entsprechende Artikel schon vorhanden ist. Evtl. muss man dann von Hand noch ein bisschen nachbessern, denn manche Artikel erscheinen nicht vollständig im Feed ("weiterlesen"-Link) oder manche Felder bleiben leer. Die abgespeicherten Artikel können noch mit Tags versehen werden. Hervorragend wäre es natürlich, wenn automatisch bestimmte Wörter, die öfter vorkommen und eine bestimmte Länge haben, in einen Index aufgenommen werden. Dann soll es natürlich eine Suche geben, nach Stichwörtern oder Tags. Vielleicht einen Index, der mir die Tags auflistet. Und die Artikel sollen in einem gut lesbaren Format angezeigt werden.

Das Ganze soll entweder auf meinem Localhost laufen oder in einem Programm auf meinem PC, also meine Sammlung soll nicht für die Öffentlichkeit zugänglich sein, sondern lediglich für mich selbst.

Bevor ich nun anfange, mir dazu etwas entsprechendes in PHP zu scripten, wollte ich mal fragen, ob jemand von Euch vielleicht schon so ein Programm oder Script etwas kennt oder ob Ihr mir ein paar Tipps geben könnt, so dass ich das mit einfachen Mitteln aus verschiedenen Tools zusammenbasteln kann.

Danke!

Gruß Markus

Content-Key: 179828

Url: https://administrator.de/contentid/179828

Printed on: April 26, 2024 at 23:04 o'clock

Member: Logan000
Logan000 Jan 31, 2012 at 11:04:36 (UTC)
Goto Top
Moin Moin

Die meisten Seiten verfügen über eine Druckansicht.
Irgendein freeware "PDF Maker" als Drucker einrichten und geschickt abspeichern.

Gruß L.
Member: markus-so
markus-so Jan 31, 2012 at 11:09:52 (UTC)
Goto Top
Dann kann ich es ja gleich ausdrucken und abheften. Gerade wenn man alles schön mit einer Suchfunktion (okay, gibt es bei PDF) durchsuchen und mit Tags versehen kann, findet man doch was wieder, was man haben will. Oder wenn Artikel von einem bestimmten Autor haben möchte, wäre das oben beschriebene von mir schon hilfreicher.
Member: brammer
brammer Jan 31, 2012 at 11:22:23 (UTC)
Goto Top
Hallo,

das ganz läuft unter dem Schlagwort "website offline verfügbar machen"

brammer