Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Wie entferne ich HTML Tags aus Excel Dateien?

Frage Microsoft Windows 7

Mitglied: hlynlc

hlynlc (Level 1) - Jetzt verbinden

18.07.2013 um 11:28 Uhr, 2625 Aufrufe, 12 Kommentare

Hallo,

ich habe eine Excel Datei (Excel 2010), welche ein Download einer HTML Seite ist. Daher beinhaltet sie viele HTML Tags, wie Sonderzeichen, etc. Nun habe ich gestern das Macro erstellt welches hier http://www.administrator.de/wissen/sonderzeichen-in-excel-per-makro-ent ... gepostet wurde.. Alles schön und gut, ABER da fallen z. B. bei <tag> die Sonerzeichen < > weg, aber 'tag' bleibt stehen.. Wie kann ich das am Besten lösen?

Vielen lieben Dank für eure Hilfe!!!


Liebe Grüße
Hülya
Mitglied: 76109
18.07.2013 um 12:27 Uhr
Hallo hlynlc!

Wie importierst Du die Html-Datei und ist das eine öffentliche Website?

Gruß Dieter
Bitte warten ..
Mitglied: hlynlc
18.07.2013 um 13:07 Uhr
Hallo Dieter,

nein es ist keine öffentliche Seite, Zugriff nur für Berechtigte. Import erfolgt durch eine selbst erstellte GUI, in der die gewisse Daten in eine Excel Liste gelesen werden und dieser dann nur zum Speichern verfügbar ist.

Liebe Grüße
Hülya
Bitte warten ..
Mitglied: 76109
18.07.2013 um 13:25 Uhr
Hallo hlynlc!

Und was hälst Du von der Möglichkeit, die Html-Datei temporär zu speichern und per Excel-QueryTable-Funktion als Tabelle zu importieren und gegebenenfalls wieder als Csv-Datei zu exportieren?

Gruß Dieter
Bitte warten ..
Mitglied: hlynlc
18.07.2013 um 13:36 Uhr
Hallo,

ich habe gerade nicht viel Ahnung , wovon du sprichst.. Aber das Prozedere des Uploads zu ändern, wäre in meinem Fall zu aufwändig.. Meine Frage deutet eher mehr auf das wie oben im ersten Post geschildert, die Idee mit dem Makro. Gibt es hierzu keinen ähnlichen Ausweg?

Danke.

Liebe Grüße
Hülya
Bitte warten ..
Mitglied: 76109
18.07.2013 um 13:53 Uhr
Hallo Hülya!

ich habe gerade nicht viel Ahnung , wovon du sprichst.. Aber das Prozedere des Uploads zu ändern, wäre in meinem Fall zu aufwändig.. Meine Frage deutet eher mehr auf das wie oben im ersten Post geschildert, die Idee mit dem Makro. Gibt es hierzu keinen ähnlichen Ausweg?

Ups, da habe ich wohl nicht richtig gelesen

Bin davon ausgegangen, dass die Html-Tags entfern werden sollen, aber sollen sie ja garnicht, insofern vergiss meine bisherigen Kommentare

Den Makro-Code schaue ich mir noch an und berichte, wenn mir was dazu einfällt...

Gruß Dieter
Bitte warten ..
Mitglied: 76109
18.07.2013, aktualisiert um 14:34 Uhr
Hallo Hülya!

Wie groß wird den die Löschliste und gibt es dazu noch eine erlaubt/nichterlaubt-Liste für Sonderzeichen?

Gruß Dieter
Bitte warten ..
Mitglied: hlynlc
18.07.2013 um 14:32 Uhr
Also die Excel Datei beinhaltet ca. 250 Zeilen, in der die Sonderzeichen gesucht und gelöscht werden sollten. Erlaubt sollten sein diese - () . , ; •
Alles andere soll und muss weg Aber wie schon erwähnt als Beispiel <div> - hier sollen zwar die Zeichen <> entfernt werden, aber auch die Buchstaben dazwischen.. Vielen lieben Dank!

Liebe Grüße
Hülya
Bitte warten ..
Mitglied: 76109
18.07.2013, aktualisiert um 15:04 Uhr
Hallo

Zunächst mal ein Beispiel zum entfernen der Tags '<div>' und '<strong>'
01.
Private Const sDelTags = "div,strong"    'Tag-Liste Kommagetrennt erweitern 
02.
 
03.
Public Sub DeleteTags() 
04.
    Dim aDelTags As Variant, vTag As Variant 
05.
     
06.
    aDelTags = Split(sDelTags, ",") 
07.
     
08.
    For Each vTag In aDelTags 
09.
        Cells.Replace "<" & Trim(vTag) & ">", "", LookAt:=xlPart, MatchCase:=False 
10.
    Next 
11.
End Sub
Mache eine Liste mit unerlaubten Sonderzeichen die gelöscht werden sollen, also genauso wie bei den Tags oder eine Liste mit Sonderzeichen, die durch andere ersetzt werden sollen z.B.:
"ä,ae,ü,ue"
wobei Du zum Löschen, das zweite Zeichen mit 0 angibst...

Gruß Dieter

[edit] Codezeile 9 geändert [/edit]
Bitte warten ..
Mitglied: hlynlc
18.07.2013 um 15:17 Uhr
Hallo Dieter,

das hat prima funktioniert. Vielen lieben Dank!!
Da HTML Tags auch ein Ende haben enthält die Datei natürlich auch solche wie </div>
Ich versuche nur einwenig den Code zu verstehen, damit ich das ergänzen kann. Wird nicht viel anders gehen, oder? Sobald ich das dann habe, kann ich die Liste mit all den Tags erweitern, die gelöscht werden sollen.

Liebe Grüße
Hülya
Bitte warten ..
Mitglied: 76109
18.07.2013, aktualisiert 19.07.2013
Hallo hlynlc!

Da HTML Tags auch ein Ende haben face-smile enthält die Datei natürlich auch solche wie </div>
Das war mir schon klar

Aber, die braucht man nicht in die Liste aufnehmen. Stattdessen einfach die Replace-Zeile kopieren und eine Zeile darunter einfügen und dann noch "<" durch "</" ersetzen...

Mit der Liste in Form "ü,ue", dann in etwa so:
01.
Private Const sReplaceChar = "ä,ae,Ä,Ae,ö,oe,Ö,Oe,ü,ue,Ü,Ue" 
02.
 
03.
    '..... 
04.
     
05.
    aReplaceChar = Split(sReplaceChar, ",")	   'String in Array splitten 
06.
     
07.
    For i = 0 To UBound(aReplaceChar) Step 2    'Array in Zweierschritten auslesen 
08.
        Cells.Replace Trim(aReplaceChar(i)), Trim(aReplaceChar(i + 1)), LookAt:=xlPart, MatchCase:=True 
09.
    Next 
10.
 
11.
    '.....
Wobei das Trim Leerzeichen entfernt, falls vorhanden

Gruß Dieter

[edit] Codezeile 8 (MatchCase:=False) geändert [/edit]
Bitte warten ..
Mitglied: hlynlc
19.07.2013 um 08:13 Uhr
Hallo Dieter,

habe es inzwischen anders gelöst, habe in die delTags Variable einfach alle vorkommenden Html Tags auch die mit der Endung eingetragen. Und es klappt
Die Zeile ist zwar jetzt länger geworden, aber sie tut was sie soll..


Die Frage wurde somit gelöst. Vielen lieben Dank für die Unterstützung!!

Liebe Grüße
Hülya
Bitte warten ..
Mitglied: 76109
19.07.2013 um 08:25 Uhr
Hallo Hülya!

Die Frage wurde somit gelöst. Vielen lieben Dank für die Unterstützung!!
Gerne doch

Und kennzeichne den Thread bitte noch als gelöst. Danke


Gruß Dieter
Bitte warten ..
Neuester Wissensbeitrag
Internet

Unbemerkt - Telekom Netzumschaltung! - BNG - Broadband Network Gateway

(3)

Erfahrungsbericht von ashnod zum Thema Internet ...

Heiß diskutierte Inhalte
Switche und Hubs
Trunk für 2xCisco Switch. Wo liegt der Fehler? (17)

Frage von JayyyH zum Thema Switche und Hubs ...

Windows Server
Outlook Verbindungsversuch mit Exchange (15)

Frage von xbast1x zum Thema Windows Server ...

Microsoft Office
Keine Updates für Office 2016 (11)

Frage von Motte990 zum Thema Microsoft Office ...