Ein E-Mail-Parser ist ein Software-Tool, das eine unbearbeitete E-Mail in ein lesbares Format umwandelt. Es gibt zwei Hauptkategorien von E-Mail-Parsern. Erstens dekodieren Low-Level-E-Mail-MIME-Parser Roh-E-Mails in ein lesbares Textformat. Zweitens wandeln High-Level-E-Mail-Content-Parser den Inhalt von E-Mails in strukturierte Daten um. Strukturierte Daten sind ein Datenformat mit struktureller Bedeutung, d. h. maschinenverständlich. Strukturierte Daten können in der Regel in Excel visualisiert oder als Eingabe für eine andere Software verwendet werden (z. B. im Rahmen eines automatisierten Geschäftsablaufs).
Infografik: Was ist ein E-Mail-Parser?
Bevor wir uns näher mit E-Mail-Parsern befassen, klären wir zunächst einige grundlegende Begriffe:
Definition von "Parsen", was Parsen ist und was Parser tun
Vielleicht hat Sie ja vor allem das Wort "Parser" abgeschreckt.
Was ist also ein Parser?
Definition von "Parsen"
Etymologisch leitet sich das Verb to parse vom lateinischen pars ab, was der Plural von part war. Ein Parser hat also etwas damit zu tun, Teile von etwas zu identifizieren.
Tatsächlich ist ein Parser ein Werkzeug, das aussagekräftige Teile in einem Text analysieren und identifizieren kann. Mit anderen Worten bedeutet Datenparsing den Prozess der Analyse einer Folge von Symbolen, entweder in natürlicher Sprache oder in Computersprachen, die den Regeln einer formalen Grammatik entsprechen (vielen Dank an Wikipedia, dass wir hier so schlau aussehen).
Ein Parser ist ein Computerprogramm, das in seinem Quellcode eine Reihe von Anweisungen definiert, um Eingabesätze zu analysieren und in Datenstrukturen umzuwandeln. Dies geschieht in der Regel mit Hilfe von Parsebäumen für die lexikalische und syntaktische Analyse.
Nehmen wir ein Beispiel, falls dies noch zu undurchsichtig ist. Während Sie genau diesen Satz lesen, eine Folge von Buchstaben auf einem Bildschirm, gibt Ihr Gehirn dem Sinn. Ihr Gehirn fungiert als Parser:
- Zunächst identifiziert es eine Folge von Buchstaben, um Wörter zu bilden. Das nennt man lexikalische Analyse.
- Dann verwendet es Grammatik und Kontext, um die Bedeutung der Wörter zu verstehen, die zusammen einen Satz ergeben. Das ist die syntaktische Analyse.
Sie sind gerade dabei zu parsen!
Parser in der Informatik
In der Informatik ist ein Parser das, was es einer Maschine ermöglicht, zu verstehen, was ein Programmierer meint, wenn er Code in der von ihm gewählten Programmiersprache eingibt. Der Parser liest den Code und wandelt ihn durch mehrere Ebenen des Parsens letztendlich in eine Reihe von 0en und 1en um, die bewirken, dass Dinge auf dem Bildschirm erscheinen oder Daten über das Internet gesendet werden.
Die Welt des Parsens in der Informatik hat einen tiefen und reichhaltigen theoretischen Hintergrund, zusammen mit Fachbegriffen wie Lexikalische Analyse, Chomsky-Grammatik, Backus-Naur-Form usw. Weitere Informationen finden Sie in dieser Einführung in Grammatik- und Parsing-Techniken im PDF-Format. Das macht eine Menge Spaß!
Nachdem dies hoffentlich geklärt ist, kommen wir nun zurück zu unseren E-Mail-Parsern.
Was ist ein MIME-Parser?
Zielgruppe: MIME-Parser sind für Personen mit einem technischen / Programmierhintergrund gedacht.
MIME (für Multipurpose Internet Mail Extensions) ist das Internet-Standardformat, in dem E-Mails kodiert sind. Das MIME-Format unterstützt die Verarbeitung verschiedener Zeichensätze, nicht-textlicher Anhänge (wie Bilder, Audio) und mehrteiliger Nachrichtentexte. Wie die meisten Internet-Standards wurde MIME durch eine Reihe von RFCs (Requests for Comment) der IETF definiert: hauptsächlich RFC 2045, RFC 2046, RFC 2047, RFC 4288, RFC 4289 und RFC 2049.
E-Mail-MIME-Parser werden verwendet, um E-Mails zu dekodieren, die in MIME kodiert sind. Solche Parser können den Header (der die E-Mail-Adresse des Absenders, die E-Mail-Adresse des Empfängers, den Betreff, das Datum usw. enthält) extrahieren, den Textkörper der E-Mail extrahieren und alle Anhänge extrahieren.
Es gibt eine große Auswahl an Open-Source-Bibliotheken, die MIME-Parsing von E-Mails in den meisten Programmiersprachen anbieten. Zum Beispiel:
- Python: E-Mail-Bibliothek
- Ruby: Mail gem
- C/C++: Mimetic oder VMime
- Java: Apache Commons Email
- PHP: MailParse
Es gibt auch eine Reihe von Online-SaaS-Plattformen, die MIME-Parsing als Service anbieten, wie z. B.:
Was ist ein E-Mail-Content-Parser?
Zielgruppe: E-Mail-Content-Parser richten sich an Personen mit einem Hintergrund in der Geschäftsprozessautomatisierung. E-Mail-Parser eignen sich hervorragend für die Automatisierung von E-Mail-Dateneingabeprozessen.
Ein großes Problem bei E-Mails ist, dass sie naturgemäß nur ein Strom unstrukturierten Textes sind. Maschinen mögen in der Regel keine unstrukturierten Daten, was es schwierig macht, eingehende E-Mails in einen Automatisierungsworkflow einzubinden.
Ein E-Mail-Content-Parser (auch bekannt als E-Mail-Scraper oder E-Mail-Datenextraktionsprogramm) ist für Personen gedacht, die einen bestimmten Textteil aus ihren E-Mails extrahieren und in eine Excel-Tabelle einfügen oder ihn zur Verarbeitung/Verfolgung an eine andere Software weiterleiten müssen. Mit anderen Worten, ein E-Mail-Content-Parser extrahiert unstrukturierten Text aus einer E-Mail und wandelt ihn in strukturierte Daten um.
Diese E-Mail-Content-Parser sind besonders nützlich, um große Mengen von maschinell generierten E-Mails zu verarbeiten.
Wann sollte man einen E-Mail-Content-Parser verwenden?
Es gibt eine Vielzahl von Bereichen, in denen E-Mail-Parser zur Automatisierung von Geschäftsprozessen eingesetzt werden.
Hier sind einige Anwendungsbeispiele für einen Content-E-Mail-Parser:
- Parsen Sie E-Commerce-Bestätigungs-E-Mails (von Marktplätzen wie Amazon, Ebay, Etsy, Craiglist usw.). Speisen Sie sie dann in eine einfache Tabellenkalkulation oder eine komplexe Logistikmanagement-Software wie SAP ein, um die Auftragsabwicklung zu verwalten und zu verfolgen
- Parsen Sie Immobilienbenachrichtigungs-E-Mails, die von verschiedenen Immobilienanzeigen-Websites stammen. Konsolidieren Sie sie dann alle in einer Tabellenkalkulation oder in Ihrer CRM-Software Ihrer Wahl (z. B. Salesforce, Pipedrive, Zoho).
- Parsen Sie Reisebestätigungs-E-Mails (z. B. Flugbestätigungen, Hotelbestätigungen, Mietwagenbestätigungen). Und speisen Sie sie in eine Software für das Geschäftsreisemanagement ein oder erstellen Sie einfach eine Reisekarte
- Parsen Sie Netzwerk- und Systemüberwachungsberichte (z. B. Pingdom, NewRelic, Dynatrace). Konsolidieren Sie alle Warnmeldungen im selben Data Warehouse, um jedes Problem automatisch und zentral zu verfolgen und zu erkennen
- Parsen Sie E-Mail-Benachrichtigungen von sozialen Netzwerken (z. B. von Twitter, Facebook, LinkedIn, Pinterest). Behalten Sie dann den Überblick und stellen Sie gegebenenfalls sicher, dass Followern gedankt wird / sie eingearbeitet / betreut werden
- Und vieles mehr, der Fantasie sind keine Grenzen gesetzt! Maschinell generierte E-Mails sind allgegenwärtig und enthalten eine Fülle von Daten, auf die Unternehmen angewiesen sind.
Was ist der Zusammenhang zwischen einem E-Mail-Parser und Parseur?
Parseur ist eine automatisierte E-Mail-Parser-Software, die Ihren Dateneingabeprozess automatisiert, indem sie jede E-Mail in eine Zeile in Ihren Google Sheets- oder Excel-Tabellenkalkulationen umwandelt.
Parseur verwendet eine Vielzahl von Parsing-Techniken, um zu erkennen, welche Vorlage für jede empfangene E-Mail verwendet werden soll, und nimmt das Parsing für jede neue gesendete E-Mail selbst vor.
Erfahren Sie mehr über die 5 Gründe, warum Parseur die Verarbeitung von E-Mails effektiver macht oder folgen Sie unserer Schritt-für-Schritt-Anleitung, wie Sie mit Parseur beginnen.
Zuletzt aktualisiert am