Provided by: linkchecker_10.0.1-2build1_amd64 bug

NAME

       linkchecker  -  Kommandozeilenprogramm  zum  Prüfen  von  HTML  Dokumenten  und  Webseiten  auf ungültige
       Verknüpfungen

SYNTAX

       linkchecker [Optionen] [Datei-oder-URL]...

BESCHREIBUNG

       LinkChecker beinhaltet

       • rekursives Prüfen und Multithreading

       • Ausgabe  als  farbigen  oder  normalen  Text,  HTML,  SQL,  CSV,  XML  oder  einen  Sitemap-Graphen  in
         verschiedenen Formaten

       • Unterstützung  von  HTTP/1.1,  HTTPS,  FTP,  mailto:, news:, nntp:, Telnet und Verknüpfungen auf lokale
         Dateien

       • Einschränkung der Linküberprüfung mit URL-Filter

       • Proxy-Unterstützung

       • Benutzer/Passwort Authorisierung für HTTP, FTP und Telnet

       • Unterstützung des robots.txt Protokolls

       • Unterstützung für Cookies

       • Unterstützung für HTML5

       • HTML- und CSS-Syntaxprüfung

       • Antivirusprüfung

       • ein Kommandozeilenprogramm und web interface

BEISPIELE

       Der häufigste Gebrauchsfall prüft die angegebene Domäne rekursiv:

          $ linkchecker http://www.example.com/

       Beachten Sie dass dies die komplette Domäne überprüft, welche aus mehreren tausend  URLs  bestehen  kann.
       Benutzen Sie die Option -r, um die Rekursionstiefe zu beschränken.

       Prüfe keine /secret URLs. Alle anderen Verknüpfungen werden wie üblich geprüft:

          $ linkchecker --ignore-url=/secret mysite.example.com

       Überprüfung einer lokalen HTML Datei unter Unix:

          $ linkchecker ../bla.html

       Überprüfung einer lokalen HTML Datei unter Windows:

          C:\> linkchecker c:empest.html

       Sie können den http:// URL Anteil weglassen wenn die Domäne mit www. beginnt:

          $ linkchecker www.example.com

       Sie können den ftp:// URL Anteil weglassen wenn die Domäne mit ftp. beginnt:

          $ linkchecker -r0 ftp.example.com

       Erzeuge einen Sitemap Graphen und konvertiere ihn mit dem graphviz dot Programm:

          $ linkchecker -odot -v www.example.com | dot -Tps > sitemap.ps

OPTIONEN

   Allgemeine Optionen
       -f FILENAME, --config=FILENAME
              Benutze     DATEINAME     als     Konfigurationsdatei.     Standardmäßig    benutzt    LinkChecker
              ~/.linkchecker/linkcheckerrc.

       -h, --help
              Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.

       --stdin
              Lese Liste von URLs zum Prüfen von der Standardeingabe, getrennt durch Leerzeichen.

       -t NUMBER, --threads=NUMBER
              Generiere nicht mehr als die angegebene Anzahl von Threads. Die Standardanzahl von Threads ist 10.
              Um Threads zu deaktivieren, geben Sie eine nicht positive Nummer an.

       -V, --version
              Gebe die Version aus und beende das Programm.

       --list-plugins
              Print available check plugins and exit.

   Ausgabeoptionen
       -D STRING, --debug=STRING
              Gebe Testmeldungen aus für den angegebenen  Logger.  Verfügbare  Logger  sind  cmdline,  checking,
              cache,  dns,  plugin  und  all.  Die Angabe all ist ein Synonym für alle verfügbaren Logger. Diese
              Option kann mehrmals angegeben werden, um mit  mehr  als  einem  Logger  zu  testen.  Um  akkurate
              Ergebnisse zu erzielen, werden Threads deaktiviert.

       -F TYPE[/ENCODING][/FILENAME], --file-output=TYPE[/ENCODING][/FILENAME]
              Ausgabe  in  eine  Datei  namens  linkchecker-out.TYP,  $HOME/.linkchecker/failures  bei  failures
              Ausgabe, oder DATEINAME falls angegeben. Das ENCODING gibt die Ausgabekodierung an.  Der  Standard
              ist   das   der   lokalen   Spracheinstellung.   Gültige   Enkodierungen  sind  aufgelistet  unter
              https://docs.python.org/library/codecs.html#standard-encodings. Der DATEINAME und ENKODIERUNG Teil
              wird beim Ausgabetyp none ignoriert, ansonsten wird die Datei überschrieben falls  sie  existiert.
              Sie können diese Option mehr als einmal verwenden. Gültige Ausgabetypen sind text, html, sql, csv,
              gml, dot, xml, sitemap, none oder failures. Standard ist keine Dateiausgabe. Die unterschiedlichen
              Ausgabetypen  sind  weiter  unten  dokumentiert.  Beachten  Sie,  dass  Sie mit der Option -o none
              jegliche Ausgaben auf der Konsole verhindern können.

       --no-status
              Gebe keine Statusmeldungen aus.

       --no-warnings
              Gebe keine Warnungen aus. Standard ist die Ausgabe von Warnungen.

       -o TYPE[/ENCODING], --output=TYPE[/ENCODING]
              Gib Ausgabetyp als text, html, sql, csv, gml, dot, xml, sitemap, none oder  failures  an.  Stadard
              Typ  ist  text.  Die  verschiedenen  Ausgabetypen  sind  unten dokumentiert. Das ENCODING gibt die
              Ausgabekodierung an. Der Standard ist das der  lokalen  Spracheinstellung.  Gültige  Enkodierungen
              sind aufgelistet unter https://docs.python.org/library/codecs.html#standard-encodings.

       -q, --quiet
              Keine Ausgabe, ein Alias für -o none. Dies ist nur in Verbindung mit -F nützlich.

       -v, --verbose
              Gebe alle geprüften URLs aus. Standard ist es, nur fehlerhafte URLs und Warnungen auszugeben.

       -W REGEX, --warning-regex=REGEX
              Definieren  Sie  einen  regulären  Ausdruck der eine Warnung ausgibt falls er auf den Inhalt einer
              geprüften URL zutrifft. Dies gilt nur  für  gültige  Seiten  deren  Inhalt  wir  bekommen  können.
              Benutzen  Sie  dies,  um  nach  Seiten  zu suchen, welche bestimmte Fehler enthalten, zum Beispiel
              "Diese Seite ist umgezogen" oder "Oracle "Applikationsfehler". Man beachte, dass mehrere Werte  in
              dem  regulären  Ausdruck kombiniert werden können, zum Beispiel "(Diese Seite ist umgezogen|Oracle
              Applikationsfehler)". Siehe Abschnitt REGULAR EXPRESSIONS für weitere Infos.

   Optionen zum Prüfen
       --cookiefile=FILENAME
              Lese eine Datei mit Cookie-Daten. Das Cookie Datenformat wird weiter unten erklärt.

       --check-extern
              Check external URLs.

       --ignore-url=REGEX
              URLs matching the given regular expression will only be syntax checked. This option can  be  given
              multiple times. See section REGULAR EXPRESSIONS for more info.

       -N STRING, --nntp-server=STRING
              Gibt  ein NNTP Rechner für news: Links. Standard ist die Umgebungsvariable NNTP_SERVER. Falls kein
              Rechner angegeben ist, wird lediglich auf korrekte Syntax des Links geprüft.

       --no-follow-url=REGEX
              Prüfe URLs die auf den regulären Ausdruck zutreffen,  aber  führe  keine  Rekursion  durch.  Diese
              Option kann mehrmals angegeben werden. Siehe Abschnitt REGULAR EXPRESSIONS für weitere Infos.

       --no-robots
              Check URLs regardless of any robots.txt files.

       -p, --password
              Liest  ein  Passwort von der Kommandozeile und verwende es für HTTP und FTP Autorisierung. Für FTP
              ist das Standardpasswort anonymous@. Für HTTP gibt es kein Standardpasswort. Siehe auch -u.

       -r NUMBER, --recursion-level=NUMBER
              Prüfe rekursiv alle URLs bis zu der angegebenen Tiefe.  Eine  negative  Tiefe  bewirkt  unendliche
              Rekursion. Standard Tiefe ist unendlich.

       --timeout=NUMBER
              Setze den Timeout für TCP-Verbindungen in Sekunden. Der Standard Timeout ist 60 Sekunden.

       -u STRING, --user=STRING
              Verwende  den  angegebenen  Benutzernamen  für  HTTP  und  FTP  Autorisierung.  Für  FTP  ist  der
              Standardname anonymous. Für HTTP gibt es keinen Standardnamen. Siehe auch -p.

       --user-agent=STRING
              Gibt den User-Agent an, der zu HTTP-Servern geschickt wird, z.B. "Mozilla/4.0". Der  Standard  ist
              "LinkChecker/X.Y", wobei X.Y die aktuelle Version von LinkChecker ist.

KONFIGURATIONSDATEIEN

       Konfigurationsdateien  können alle obigen Optionen enthalten. Sie können zudem Optionen enthalten, welche
       nicht auf der Kommandozeile gesetzt werden können. Siehe linkcheckerrc(5) für mehr Informationen.

AUSGABETYPEN

       Beachten Sie, dass standardmäßig nur Fehler und Warnungen protokolliert werden. Sie sollten die --verbose
       Option benutzen, um eine komplette URL Liste zu erhalten, besonders bei Ausgabe eines Sitemap-Graphen.

       text   Standard Textausgabe in "Schlüssel: Wert"-Form.

       html   Gebe URLs in "Schlüssel: Wert"-Form als HTML formatiert aus. Besitzt zudem Verknüpfungen  auf  die
              referenzierten  Seiten.  Ungültige  URLs  haben  Verknüpfungen  zur  HTML  und  CSS  Syntaxprüfung
              angehängt.

       csv    Gebe Prüfresultat in CSV-Format aus mit einer URL pro Zeile.

       gml    Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.

       dot    Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als DOT Graphen aus.

       gxml   Gebe Prüfresultat als GraphXML-Datei aus.

       xml    Gebe Prüfresultat als maschinenlesbare XML-Datei aus.

       sitemap
              Protokolliere     Prüfergebnisse      als      XML      Sitemap      dessen      Format      unter
              https://www.sitemaps.org/protocol.html dokumentiert ist.

       sql    Gebe  Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein Beispielskript, um die initiale SQL
              Tabelle zu erstellen ist unter create.sql zu finden.

       failures
              Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei ~/.linkchecker/failures aus, welche nur
              Einträge mit fehlerhaften URLs und die Anzahl der Fehlversuche enthält.

       none   Gibt nichts aus. Für Debugging oder Prüfen des Rückgabewerts geeignet.

REGULÄRE AUSDRÜCKE

       LinkChecker akzeptiert Pythons reguläre  Ausdrücke.  Siehe  https://docs.python.org/howto/regex.html  für
       eine  Einführung.  Eine  Ergänzung  ist,  dass  ein  regulärer  Ausdruck  negiert wird falls er mit einem
       Ausrufezeichen beginnt.

COOKIE-DATEIEN

       Eine Cookie-Datei enthält Standard HTTP-Header (RFC 2616) mit den folgenden möglichen Namen:

       Host (erforderlich)
              Setzt die Domäne für die die Cookies gültig sind.

       Path (optional)
              Gibt den Pfad für den die Cookies gültig sind; Standardpfad ist /.

       Set-cookie (erforderlich)
              Setzt den Cookie Name/Wert. Kann mehrmals angegeben werden.

       Mehrere Einträge sind durch eine Leerzeile zu trennen. Das untige Beispiel sendet zwei Cookies  zu  allen
       URLs  die  mit  http://example.org/hello/  beginnen,  und  eins zu allen URLs die mit https://example.org
       beginnen:

          Host: example.com
          Path: /hello
          Set-cookie: ID="smee"
          Set-cookie: spam="egg"

          Host: example.org
          Set-cookie: baggage="elitist"; comment="hologram"

PROXY UNTERSTÜTZUNG

       Um einen Proxy unter Unix oder Windows zu benutzen, setzen Sie die http_proxy, https_proxy oder ftp_proxy
       Umgebungsvariablen auf die Proxy URL. Die URL sollte die  Form  http://[user:pass@]host[:port]  besitzen.
       LinkChecker  erkennt  auch  die  Proxy-Einstellungen des Internet Explorers auf einem Windows-System, und
       GNOME oder KDE auf Linux Systemen. Auf einem Mac benutzen Sie die Internet Konfiguration. Sie können eine
       komma-separierte Liste von Domainnamen in der no_proxy Umgebungsvariable  setzen,  um  alle  Proxies  für
       diese Domainnamen zu ignorieren.

       Einen HTTP-Proxy unter Unix anzugeben sieht beispielsweise so aus:

          $ export http_proxy="http://proxy.example.com:8080"

       Proxy-Authentifizierung wird ebenfalls unterstützt:

          $ export http_proxy="http://user1:mypass@proxy.example.org:8081"

       Setzen eines Proxies unter der Windows Befehlszeile:

          C:\> set http_proxy=http://proxy.example.com:8080

DURCHGEFÜHRTE PRÜFUNGEN

       Alle  URLs  müssen  einen  ersten Syntaxtest bestehen. Kleine Kodierungsfehler ergeben eine Warnung, jede
       andere ungültige Syntaxfehler sind Fehler. Nach dem Bestehen des Syntaxtests wird die URL in die Schlange
       zum Verbindungstest gestellt. Alle Verbindungstests sind weiter unten beschrieben.

       HTTP Verknüpfungen (http:, https:)
              Nach Verbinden zu dem gegebenen HTTP-Server wird der eingegebene Pfad oder Query angefordert. Alle
              Umleitungen werden verfolgt, und falls ein Benutzer/Passwort angegeben wurde  werden  diese  falls
              notwendig  als  Authorisierung  benutzt.  Alle  finalen HTTP Statuscodes, die nicht dem Muster 2xx
              entsprechen, werden als Fehler ausgegeben.

              Der Inhalt von HTML-Seiten wird rekursiv geprüft.

       Lokale Dateien (file:)
              Eine reguläre, lesbare Datei die geöffnet werden kann ist gültig.  Ein  lesbares  Verzeichnis  ist
              ebenfalls gültig. Alle anderen Dateien, zum Beispiel Gerätedateien, unlesbare oder nicht existente
              Dateien ergeben einen Fehler.

              HTML- oder andere untersuchbare Dateiinhalte werden rekursiv geprüft.

       Mail-Links (mailto:)
              Ein  mailto:-Link  ergibt  eine Liste von E-Mail-Adressen. Falls eine Adresse fehlerhaft ist, wird
              die ganze Liste als fehlerhaft angesehen. Für  jede  E-Mail-Adresse  werden  die  folgenden  Dinge
              geprüft:

              1. Check the address syntax, both the parts before and after the @ sign.

              2. Look up the MX DNS records. If we found no MX record, print an error.

              3. Check  if  one  of  the  mail hosts accept an SMTP connection. Check hosts with higher priority
                 first. If no host accepts SMTP, we print a warning.

              4. Try to verify the address with the VRFY command. If  we  got  an  answer,  print  the  verified
                 address as an info.

       FTP-Links (ftp:)
              Für FTP-Links wird Folgendes geprüft:

              1. Eine Verbindung zum angegeben Rechner wird aufgebaut

              2. Versuche,  sich  mit  dem  gegebenen  Nutzer  und Passwort anzumelden. Der Standardbenutzer ist
                 anonymous, das Standardpasswort ist anonymous@.

              3. Versuche, in das angegebene Verzeichnis zu wechseln

              4. Liste die Dateien im Verzeichnis auf mit dem NLST-Befehl

       Telnet links (telnet:)
              Versuche, zu dem angegeben Telnetrechner zu verginden und falls Benutzer/Passwort angegeben  sind,
              wird versucht, sich anzumelden.

       NNTP links (news:, snews:, nntp)
              Versuche,   zu   dem   angegebenen   NNTP-Rechner   eine   Verbindung   aufzubaucne.   Falls  eine
              Nachrichtengruppe oder ein bestimmter Artikel angegeben ist,  wird  versucht,  diese  Gruppe  oder
              diesen Artikel vom Rechner anzufragen.

       Nicht unterstützte Links (javascript:, etc.)
              Ein  nicht  unterstützter  Link  wird  nur  eine  Warnung ausgeben. Weitere Prüfungen werden nicht
              durchgeführt.

              Die komplette  Liste  von  erkannten,  aber  nicht  unterstützten  Links  ist  in  der  Quelldatei
              linkcheck/checker/unknownurl.py. Die bekanntesten davon dürften JavaScript-Links sein.

PLUGINS

       There are two plugin types: connection and content plugins. Connection plugins are run after a successful
       connection  to  the  URL  host. Content plugins are run if the URL type has content (mailto: URLs have no
       content for example) and if the check  is  not  forbidden  (ie.  by  HTTP  robots.txt).  Use  the  option
       --list-plugins  for  a  list  of  plugins  and  their  documentation.  All  plugins  are  enabled via the
       linkcheckerrc(5) configuration file.

REKURSION

       Bevor eine URL rekursiv geprüft wird,  hat  diese  mehrere  Bedingungen  zu  erfüllen.  Diese  werden  in
       folgender Reihenfolge geprüft:

       1. Eine URL muss gültig sein.

       2. Der  URL-Inhalt  muss analysierbar sein. Dies beinhaltet zur Zeit HTML-Dateien, Opera Lesezeichen, und
          Verzeichnisse.  Falls  ein  Dateityp  nicht  erkannt  wird,  (zum  Beispiel  weil  er  keine  bekannte
          HTML-Dateierweiterung  besitzt,  und  der  Inhalt nicht nach HTML aussieht), wird der Inhalt als nicht
          analysierbar angesehen.

       3. Der URL-Inhalt muss ladbar sein. Dies ist normalerweise  der  Fall,  mit  Ausnahme  von  mailto:  oder
          unbekannten URL-Typen.

       4. Die   maximale   Rekursionstiefe   darf   nicht  überschritten  werden.  Diese  wird  mit  der  Option
          --recursion-level konfiguriert und ist standardmäßig nicht limitiert.

       5. Die URL darf nicht in der Liste von ignorierten URLs sein. Die ignorierten URLs werden mit der  Option
          --ignore-url konfiguriert.

       6. Das Robots Exclusion Protocol muss es erlauben, dass Verknüpfungen in der URL rekursiv verfolgt werden
          können. Dies wird geprüft, indem in den HTML Kopfdaten nach der "nofollow"-Direktive gesucht wird.

       Beachten  Sie,  dass  die  Verzeichnisrekursion  alle Dateien in diesem Verzeichnis liest, nicht nur eine
       Untermenge wie bspw. index.htm.

BEMERKUNGEN

       URLs von der Kommandozeile die mit ftp. beginnen werden wie  ftp://ftp.  behandelt,  URLs  die  mit  www.
       beginnen  wie  http://www.. Sie können auch lokale Dateien angeben. Falls sich Ihr System automatisch mit
       dem Internet verbindet (z.B. mit diald), wird es dies tun wenn Sie Links  prüfen,  die  nicht  auf  Ihren
       lokalen Rechner verweisen Benutzen Sie die Option --ignore-url, um dies zu verhindern.

       Javascript Links werden nicht unterstützt.

       Wenn Ihr System keine Threads unterstützt, deaktiviert diese LinkChecker automatisch.

       Sie können mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei angeben.

       Beim  Prüfen  von  news:  Links  muß  der  angegebene  NNTP  Rechner nicht unbedingt derselbe wie der des
       Benutzers sein.

UMGEBUNG

       NNTP_SERVER
              gibt Standard NNTP Server an

       http_proxy
              gibt Standard HTTP Proxy an

       ftp_proxy
              gibt Standard FTP Proxy an

       no_proxy
              kommaseparierte Liste von Domains, die nicht über einen Proxy-Server kontaktiert werden

       LC_MESSAGES, LANG, LANGUAGE
              gibt Ausgabesprache an

RÜCKGABEWERT

       Der Rückgabewert ist 2 falls

       • ein Programmfehler aufgetreten ist.

       Der Rückgabewert ist 1 falls

       • ungültige Verknüpfungen gefunden wurden oder

       • Warnungen gefunden wurden und Warnungen aktiviert sind

       Sonst ist der Rückgabewert Null.

LIMITIERUNGEN

       LinkChecker benutzt Hauptspeicher für jede zu prüfende URL, die in der Warteschlange steht. Mit tausenden
       solcher URLs kann die Menge des benutzten Hauptspeichers sehr groß werden. Dies könnte das Programm  oder
       sogar das gesamte System verlangsamen.

DATEIEN

       ~/.linkchecker/linkcheckerrc - Standardkonfigurationsdatei

       ~/.linkchecker/failures - Standard Dateiname der failures Logger Ausgabe

       linkchecker-out.TYP - Standard Dateiname der Logausgabe

SIEHE AUCH

       linkcheckerrc(5)

       https://docs.python.org/library/codecs.html#standard-encodings - gültige Ausgabe Enkodierungen

       https://docs.python.org/howto/regex.html - Dokumentation zu regulären Ausdrücken

AUTHOR

       Bastian Kleineidam <bastian.kleineidam@web.de>

COPYRIGHT

       2000-2016 Bastian Kleineidam, 2010-2021 LinkChecker Authors

2021-01-28                                       Januar 28, 2021                                  LINKCHECKER(1)