Zahlenreihen aus Webseite auslesen und in Mengenschreibweise in txt datei speichern?

bernd

Neues Mitglied
Hallo, es geht bei meinem Problem ziemlich genau um diese Seite:
Wie man sieht steht dort in jeder Zeile ein "Ticket" gefolgt von einer unwichtigen Zahl, dann einem ":" und dann 6 Zahlen.
ich hätte gerne diese 6 zahlen in jeder zeile in einer passenden mengenschreibweise aus der webseite rausgezogen und in einem pdf gespeichert.
Sprich auf der webseite steht

Ticket 1 : 1 6 7 17 23 46
Ticket 2 : 1 6 9 25 32 45
...
was ich gerne später in einer txt datei stehen haben wollen würde in der form
{ {1,6,7,17,23,46} , {1,6,9,25,32,45} , ... }

hat den hintergrund dass ich dieses geschriebene später als ArrayList<ArrayList<Long>> zu interpretieren gedenke und damit dann weiter werkeln will.

Frage ist nur, wie oder womit bekomme ich diese Zahlenreihe von der Webseite am besten ausgelesen und in der erwähnten Form in einer txt auf meinem computer abgespeichert?
 

PosChris

Neues Mitglied
das ist eigentlich relativ simpel mit php zu machen.
file_get_contents auf die domain um den code zu bekommen und dann per DomDocument im Php parsen lassen.
per $dom->getElementsByTagName( 'pre' )[0]; kommste auf den pre - knoten, in dem die daten stehen. diese kannste parsen. erst per \n die einzelnen zeilen auslesen und dann per explode auf " " kommste direkt an alle werte. alternativ per regulärem ausdruck
 

Dompteur

Neues Mitglied
Fast jede aktuelle General Purpose Language bietet die Möglichkeit über http/https den Inhalt einer Webseite abzufragen.
Entweder als Teil der Sprache oder über Libraries.
Hier hast du sogar das Glück, dass die Seite statisch ist (= es werden keine Teile der Seite nachgeladen).

Verwendest du üblicherweise Java ?
Dann schaue dir dieses Kapitel aus dem Oracle Java Tutorial an : https://docs.oracle.com/javase/tutorial/networking/urls/index.html
Da findest du auch ein einfaches Beispielsprogramm zum Lesen einer Seite.

Die Seite, die du da angegeben hast, ist sehr einfach strukturiert. Der Block, der dich interessiert befindet sich innerhalb des einzigen PRE Tags. Natürlich kannst du nun einen HTML Parser verwenden, um darauf zurückzugreifen.
In diesem einfachen Fall kannst du aber den relevanten Ausschnitt auch mit einfachen String Funktionen herauslösen.
 
Oben Unten