Jan 12, 2011, updated at Jan 28, 2011 (UTC)

4098

Preg match soll nach erster Übereinstimmung beendet werden

Guten Tag,

da ich mir zurzeit die regulären Ausdrücke genauer anschaue und dazu ein paar Übungen mache, bin ich nun auf ein Problem gestoßen. Ich möchte mit preg_match eine bestimmte Stelle vom Quelltext suchen, und dessen Link auslesen. Jedoch kommt das Ende der Stelle im Quelltext öfters vor. Jedoch soll preg_match nach der ersten Übereinstimmung beendet werden, jedoch funktioniert das nicht. Preg_match geht den kompletten Quelltext durch und gibt alle Suchergebnisse bis zum Ende des Quelltextes aus. Hier der original Quelltext, ihr könnt ihn ja testen, falls ihr mir nun nicht richtig verstanden habt.

<?php

$link = "http://themen.t-online.de/news/baugewerbe";  

$quelltext = file_get_contents($link);
preg_match("/ id=\"tscc\.hub\.1\.home\.title\" href=\".+\" class=\"tsc_restitle\"/",$quelltext,$img_tag);  
$filter = htmlentities($img_tag);
echo $filter;
?>

Es sollte einfach die Quelltextstelle von id="tsc.... bis class="tsc_restitle" ausgeben. Das id="tsc usw. würde ich dann später noch mit str_replace wegfiltern.

Vielleicht sieht ja einer von euch den Fehler

mfg Lampux

Please also mark the comments that contributed to the solution of the article

Content-Key: 158447

Url: https://administrator.de/contentid/158447

Printed on: April 23, 2024 at 12:04 o'clock

13 Comments

Latest comment

Hallo Lampux,

ich glaube, dein Problem verstanden zu haben, und hätte folgende Lösung für Dich:

mit der Funktion "stripos" findest du das erste Vorkommen einer Zeichenkette in einem String. Da du weißt, wie lange die Zeichenkette ist, nach der du suchst machst du folgendes:

$needle = '/ id=\"tscc\.hub\.1\.home\.title\" href=\".+\" class=\"tsc_restitle\"/';  
$erstePosition = stripos($quelltext, $needle);
$quelltext = substr($quelltext, 0, ($erstePosition + strlen($erstePosition));   //gibt nur noch den Teil übrigen Teil des Quelltextes aus

ist das das was du suchst? Bin mir nicht ganz sicher..

lg

Leider kommt bei deiner Lösung eine leere Seite. Kleine Anmerkung am Rande: in Zeile 3 fehlt am Schluss noch eine runde Klammer

. Um das Problem ein bisschen genauer zu erklären:

Im Quelltext kommt diese Stelle einmalig vor. Von dieser Stelle aus, sollte es suchen:

id="tscc.hub.1.home.title" href="

bis zu dieser Stelle, die mehrmals im Quelltext vorkommt:

class="tsc_restitle"

Da diese Stelle mehrfach im Quelltext vorkommt, gibt er mit den ganzen Quelltext von Begin der ersten einmaligen Stelle bis zur letzen vorkommenden class="tsc_restitle" Stelle aus.

Ich möchte einfach nur, das das Gesuch nach dem ersten Finden von class="tsc_restitle" aufhört. Zwischen den beiden Stellen befinden sich ein Link, diesen möchte ich auslesen.

Ich hoffe nun das es ein wenig verständlich war

mfg Lampux

Hey. Jetzt versteh ich was du meinst. Okay, dann ist die Lösung recht einfach und ähnlich wie oben:

Du suchst das erste "id="tscc.hub.1.home.title" href="" im Quelltext mit "stripos".

Dann zerlegst du den Quelltext anhand dieser Position:

$quelltext = substr($stripos, strlen($quelltext));
//jetzt hast du einen Quelltext der erst anfängt, wo der Link beginnt.
//damit kannst du einfach arbeiten: Suche das erste vorkommen von "class="tsc_restitle"": 
$letztes_Zeichen = stripos('class="tsc_restitle"');  
$erstes_Zeichen = strlen('id="tscc.hub.1.home.title" href="')  

$link = substr($quelltext, $erstes_Zeichen, $letztes_Zeichen);

Hats funktioniert ?

lg

PS: Hab mir dein Code nochmal angeguckt. Versuche, weniger zu escapen. Verwende doppelte und einfache Anführungsstriche, das macht es übersichtlicher. =)

Ich glaube wir sind nahe an der Lösung, leider wirft es noch eine Fehlermeldung:

Parse error: syntax error, unexpected T_VARIABLE in C:\xampp\htdocs\such3.php on line 11

Hier der aktuelle Quelltext:

<?php

$link = "http://themen.t-online.de/news/baugewerbe";  
$quelltext = file_get_contents($link);
$quelltext = substr($stripos, strlen($quelltext));
//jetzt hast du einen Quelltext der erst anfängt, wo der Link beginnt.
//damit kannst du einfach arbeiten: Suche das erste vorkommen von "class="tsc_restitle"": 
$letztes_Zeichen = stripos('class="tsc_restitle"');  
$erstes_Zeichen = strlen('id="tscc.hub.1.home.title" href="')  

$link = substr($quelltext, $erstes_Zeichen, $letztes_Zeichen);
echo $link;
?>

wie wärs mit einem ; in zeile 9 am ende ?

Stimmt! Leider kommt nun:

Warning: stripos() expects at least 2 parameters, 1 given in C:\xampp\htdocs\such3.php on line 8

Dokuvorleseservice php.net/stripos

int stripos ( string $haystack , string $needle [, int $offset = 0 ] )

Lösungsservice

<?php 

$link = "http://themen.t-online.de/news/baugewerbe";   
$quelltext = file_get_contents($link); 
$quelltext = substr($stripos, strlen($quelltext)); 
//jetzt hast du einen Quelltext der erst anfängt, wo der Link beginnt. 
//damit kannst du einfach arbeiten: Suche das erste vorkommen von "class="tsc_restitle"":  

$letztes_Zeichen = stripos($quelltext, 'class="tsc_restitle"');   
$erstes_Zeichen = strlen('id="tscc.hub.1.home.title" href="');  

$link = substr($quelltext, $erstes_Zeichen, $letztes_Zeichen); 

echo $link; 

?>

Debugservice

$stripos is not defined

nobody's perfect^^

naja, das wird er jetzt wohl selbst hinbekommen

Danke Leute. Jedoch zeigt es mir immer noch eine weiße Seite an. Und mit dieser Meldung kann ich leider nichts anfangen:

$stripos is not defined

preg_match sucht im Gegensatz zu preg_match_all nur ein Vorkommen einer Code-Stelle und gibt das aus.
Du hast aber .+ geschrieben und die Funktion somit greedy gemacht.
Spricht: Er gibt alles vom ersten Vorkommen des Textes links vom .+ und alles bis zum letzen Vorkommen des Textes rechts von .+ aus.
Was du willst ist ungreedy: .+?

Genau das wollte ich. Vielen Dank, es funktioniert einwandfrei.

German closed solved Question PHP Development

Hotly discussed

Check of ZFW Firewallgleixnerd - 5 Comments

Wireguard VPN on UDM Pro behind Fritzbox - Handshake did not completejstricker - 3 Comments

How to set up and configure a Linux GRE tunnelAlexWisha - 3 Comments

End of Support dates for Office 2016, 2019 Apps und Productivity ServersDani - 1 Comment