Provided by: linkchecker_10.5.0-1_amd64 bug

NAME

       linkchecker  -  Kommandozeilenprogramm  zum  Prüfen  von  HTML  Dokumenten  und  Webseiten  auf ungültige
       Verknüpfungen

SYNTAX

       linkchecker [Optionen] [Datei-oder-URL]...

BESCHREIBUNG

       LinkChecker beinhaltet

       • rekursives Prüfen und Multithreading

       • Ausgabe  als  farbigen  oder  normalen  Text,  HTML,  SQL,  CSV,  XML  oder  einen  Sitemap-Graphen  in
         verschiedenen Formaten

       • support for HTTP/1.1, HTTPS, FTP, mailto: and local file links

       • Einschränkung der Linküberprüfung mit URL-Filter

       • Proxy-Unterstützung

       • username/password authorization for HTTP and FTP

       • Unterstützung des robots.txt Protokolls

       • Unterstützung für Cookies

       • Unterstützung für HTML5

       • Antivirusprüfung

       • ein Kommandozeilenprogramm und web interface

BEISPIELE

       Der häufigste Gebrauchsfall prüft die angegebene Domäne rekursiv:

          $ linkchecker http://www.example.com/

       Beachten  Sie  dass  dies die komplette Domäne überprüft, welche aus mehreren tausend URLs bestehen kann.
       Benutzen Sie die Option -r, um die Rekursionstiefe zu beschränken.

       Prüfe keine /secret URLs. Alle anderen Verknüpfungen werden wie üblich geprüft:

          $ linkchecker --ignore-url=/secret mysite.example.com

       Überprüfung einer lokalen HTML Datei unter Unix:

          $ linkchecker ../bla.html

       Überprüfung einer lokalen HTML Datei unter Windows:

          C:\> linkchecker c:empest.html

       Sie können den http:// URL Anteil weglassen wenn die Domäne mit www. beginnt:

          $ linkchecker www.example.com

       Sie können den ftp:// URL Anteil weglassen wenn die Domäne mit ftp. beginnt:

          $ linkchecker -r0 ftp.example.com

       Erzeuge einen Sitemap Graphen und konvertiere ihn mit dem graphviz dot Programm:

          $ linkchecker -odot -v www.example.com | dot -Tps > sitemap.ps

OPTIONEN

   Allgemeine Optionen
       -f FILENAME, --config=FILENAME
              Use     FILENAME     as     configuration     file.     By      default      LinkChecker      uses
              $XDG_CONFIG_HOME/linkchecker/linkcheckerrc.

       -h, --help
              Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.

       -t NUMBER, --threads=NUMBER
              Generiere nicht mehr als die angegebene Anzahl von Threads. Die Standardanzahl von Threads ist 10.
              Um Threads zu deaktivieren, geben Sie eine nicht positive Nummer an.

       -V, --version
              Gebe die Version aus und beende das Programm.

       --list-plugins
              Print available check plugins and exit.

   Ausgabeoptionen
   URL checking results
       -F TYPE[/ENCODING][/FILENAME], --file-output=TYPE[/ENCODING][/FILENAME]
              Output to a file linkchecker-out.TYPE, $XDG_DATA_HOME/linkchecker/failures for the failures output
              type, or FILENAME if specified. The ENCODING specifies the output encoding, the default is that of
              your         locale.         Valid         encodings         are         listed        at        ‐
              https://docs.python.org/library/codecs.html#standard-encodings. The FILENAME and ENCODING parts of
              the none output type will be ignored, else if the file already exists, it will be overwritten. You
              can specify this option more than once. Valid file output TYPEs are text,  html,  sql,  csv,  gml,
              dot,  xml,  sitemap,  none  or  failures.  Default is no file output. The various output types are
              documented below. Note that you can suppress all console output with the option -o none.

       --no-warnings
              Gebe keine Warnungen aus. Standard ist die Ausgabe von Warnungen.

       -o TYPE[/ENCODING], --output=TYPE[/ENCODING]
              Specify the console output type as text, html, sql, csv, gml, dot, xml, sitemap, none or failures.
              Default type is text. The various output types are documented below. The  ENCODING  specifies  the
              output  encoding,  the  default  is  that  of  your  locale.  Valid  encodings  are  listed  at  ‐
              https://docs.python.org/library/codecs.html#standard-encodings.

       -v, --verbose
              Log all checked URLs, overriding --no-warnings. Default is to log only errors and warnings.

   Progress updates
       --no-status
              Do not print URL check status messages.

   Application
       -D STRING, --debug=STRING
              Print debugging output for the given logger. Available debug loggers are cmdline, checking, cache,
              plugin and all. all is an alias for all available loggers. This option can be given multiple times
              to debug with more than one logger.

   Quiet
       -q, --quiet
              Quiet operation, an alias for -o none that also hides application information  messages.  This  is
              only useful with -F, else no results will be output.

   Optionen zum Prüfen
       --cookiefile=FILENAME
              Use initial cookie data read from a file. The cookie data format is explained below.

       --check-extern
              Check external URLs.

       --ignore-url=REGEX
              URLs  matching  the given regular expression will only be syntax checked. This option can be given
              multiple times. See section REGULAR EXPRESSIONS for more info.

       --no-follow-url=REGEX
              Prüfe URLs die auf den regulären Ausdruck zutreffen,  aber  führe  keine  Rekursion  durch.  Diese
              Option kann mehrmals angegeben werden. Siehe Abschnitt REGULAR EXPRESSIONS für weitere Infos.

       --no-robots
              Check URLs regardless of any robots.txt files.

       -p, --password
              Liest  ein  Passwort von der Kommandozeile und verwende es für HTTP und FTP Autorisierung. Für FTP
              ist das Standardpasswort anonymous@. Für HTTP gibt es kein Standardpasswort. Siehe auch -u.

       -r NUMBER, --recursion-level=NUMBER
              Prüfe rekursiv alle URLs bis zu der angegebenen Tiefe.  Eine  negative  Tiefe  bewirkt  unendliche
              Rekursion. Standard Tiefe ist unendlich.

       --timeout=NUMBER
              Setze den Timeout für TCP-Verbindungen in Sekunden. Der Standard Timeout ist 60 Sekunden.

       -u STRING, --user=STRING
              Verwende  den  angegebenen  Benutzernamen  für  HTTP  und  FTP  Autorisierung.  Für  FTP  ist  der
              Standardname anonymous. Für HTTP gibt es keinen Standardnamen. Siehe auch -p.

       --user-agent=STRING
              Gibt den User-Agent an, der zu HTTP-Servern geschickt wird, z.B. "Mozilla/4.0". Der  Standard  ist
              "LinkChecker/X.Y", wobei X.Y die aktuelle Version von LinkChecker ist.

   Input options
       --stdin
              Read from stdin a list of white-space separated URLs to check.

       FILE-OR-URL
              The  location  to  start  checking with. A file can be a simple list of URLs, one per line, if the
              first line is "# LinkChecker URL list".

KONFIGURATIONSDATEIEN

       Konfigurationsdateien können alle obigen Optionen enthalten. Sie können zudem Optionen enthalten,  welche
       nicht auf der Kommandozeile gesetzt werden können. Siehe linkcheckerrc(5) für mehr Informationen.

AUSGABETYPEN

       Beachten Sie, dass standardmäßig nur Fehler und Warnungen protokolliert werden. Sie sollten die --verbose
       Option benutzen, um eine komplette URL Liste zu erhalten, besonders bei Ausgabe eines Sitemap-Graphen.

       text   Standard Textausgabe in "Schlüssel: Wert"-Form.

       html   Gebe  URLs  in "Schlüssel: Wert"-Form als HTML formatiert aus. Besitzt zudem Verknüpfungen auf die
              referenzierten  Seiten.  Ungültige  URLs  haben  Verknüpfungen  zur  HTML  und  CSS  Syntaxprüfung
              angehängt.

       csv    Gebe Prüfresultat in CSV-Format aus mit einer URL pro Zeile.

       gml    Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.

       dot    Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als DOT Graphen aus.

       gxml   Gebe Prüfresultat als GraphXML-Datei aus.

       xml    Gebe Prüfresultat als maschinenlesbare XML-Datei aus.

       sitemap
              Protokolliere     Prüfergebnisse     als     XML     Sitemap     dessen     Format     unter     ‐
              https://www.sitemaps.org/protocol.html dokumentiert ist.

       sql    Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein Beispielskript, um die initiale  SQL
              Tabelle zu erstellen ist unter create.sql zu finden.

       failures
              Suitable  for  cron  jobs.  Logs  the check result into a file $XDG_DATA_HOME/linkchecker/failures
              which only contains entries with invalid URLs and the number of times they have failed.

       none   Gibt nichts aus. Für Debugging oder Prüfen des Rückgabewerts geeignet.

REGULÄRE AUSDRÜCKE

       LinkChecker akzeptiert Pythons reguläre  Ausdrücke.  Siehe  https://docs.python.org/howto/regex.html  für
       eine  Einführung.  Eine  Ergänzung  ist,  dass  ein  regulärer  Ausdruck  negiert wird falls er mit einem
       Ausrufezeichen beginnt.

COOKIE-DATEIEN

       Eine Cookie-Datei enthält Standard HTTP-Header (RFC 2616) mit den folgenden möglichen Namen:

       Host (erforderlich)
              Setzt die Domäne für die die Cookies gültig sind.

       Path (optional)
              Gibt den Pfad für den die Cookies gültig sind; Standardpfad ist /.

       Set-cookie (erforderlich)
              Setzt den Cookie Name/Wert. Kann mehrmals angegeben werden.

       Mehrere Einträge sind durch eine Leerzeile zu trennen. Das untige Beispiel sendet zwei Cookies  zu  allen
       URLs  die  mit  http://example.org/hello/  beginnen,  und  eins zu allen URLs die mit https://example.org
       beginnen:

          Host: example.com
          Path: /hello
          Set-cookie: ID="smee"
          Set-cookie: spam="egg"

          Host: example.org
          Set-cookie: baggage="elitist"; comment="hologram"

PROXY UNTERSTÜTZUNG

       To use a proxy on Unix or Windows set the http_proxy or https_proxy environment variables  to  the  proxy
       URL.  The URL should be of the form http://[user:pass@]host[:port]. LinkChecker also detects manual proxy
       settings of Internet Explorer under Windows systems. On a Mac use the Internet Config to select a  proxy.
       You  can  also set a comma-separated domain list in the no_proxy environment variable to ignore any proxy
       settings for these  domains.  The  curl_ca_bundle  environment  variable  can  be  used  to  identify  an
       alternative certificate bundle to be used with an HTTPS proxy.

       Einen HTTP-Proxy unter Unix anzugeben sieht beispielsweise so aus:

          $ export http_proxy="http://proxy.example.com:8080"

       Proxy-Authentifizierung wird ebenfalls unterstützt:

          $ export http_proxy="http://user1:mypass@proxy.example.org:8081"

       Setzen eines Proxies unter der Windows Befehlszeile:

          C:\> set http_proxy=http://proxy.example.com:8080

DURCHGEFÜHRTE PRÜFUNGEN

       Alle  URLs  müssen  einen  ersten Syntaxtest bestehen. Kleine Kodierungsfehler ergeben eine Warnung, jede
       andere ungültige Syntaxfehler sind Fehler. Nach dem Bestehen des Syntaxtests wird die URL in die Schlange
       zum Verbindungstest gestellt. Alle Verbindungstests sind weiter unten beschrieben.

       HTTP Verknüpfungen (http:, https:)
              Nach Verbinden zu dem gegebenen HTTP-Server wird der eingegebene Pfad oder Query angefordert. Alle
              Umleitungen werden verfolgt, und falls ein Benutzer/Passwort angegeben wurde  werden  diese  falls
              notwendig  als  Authorisierung  benutzt.  Alle  finalen HTTP Statuscodes, die nicht dem Muster 2xx
              entsprechen, werden als Fehler ausgegeben.

              Der Inhalt von HTML-Seiten wird rekursiv geprüft.

       Lokale Dateien (file:)
              Eine reguläre, lesbare Datei die geöffnet werden kann ist gültig.  Ein  lesbares  Verzeichnis  ist
              ebenfalls gültig. Alle anderen Dateien, zum Beispiel Gerätedateien, unlesbare oder nicht existente
              Dateien ergeben einen Fehler.

              HTML- oder andere untersuchbare Dateiinhalte werden rekursiv geprüft.

       Mail-Links (mailto:)
              Ein  mailto:-Link  ergibt  eine Liste von E-Mail-Adressen. Falls eine Adresse fehlerhaft ist, wird
              die ganze Liste als fehlerhaft angesehen. Für  jede  E-Mail-Adresse  werden  die  folgenden  Dinge
              geprüft:

              1. Check the address syntax, both the parts before and after the @ sign.

              2. Look up the MX DNS records. If we found no MX record, print an error.

              3. Check  if  one  of  the  mail hosts accept an SMTP connection. Check hosts with higher priority
                 first. If no host accepts SMTP, we print a warning.

              4. Try to verify the address with the VRFY command. If  we  got  an  answer,  print  the  verified
                 address as an info.

       FTP-Links (ftp:)
              Für FTP-Links wird Folgendes geprüft:

              1. Eine Verbindung zum angegeben Rechner wird aufgebaut

              2. Versuche,  sich  mit  dem  gegebenen  Nutzer  und Passwort anzumelden. Der Standardbenutzer ist
                 anonymous, das Standardpasswort ist anonymous@.

              3. Versuche, in das angegebene Verzeichnis zu wechseln

              4. Liste die Dateien im Verzeichnis auf mit dem NLST-Befehl

       Nicht unterstützte Links (javascript:, etc.)
              Ein nicht unterstützter Link wird nur  eine  Warnung  ausgeben.  Weitere  Prüfungen  werden  nicht
              durchgeführt.

              Die  komplette  Liste  von  erkannten,  aber  nicht  unterstützten  Links  ist in der Quelldatei ‐
              linkcheck/checker/unknownurl.py. Die bekanntesten davon dürften JavaScript-Links sein.

SITEMAPS

       Sitemaps are parsed for links to check and can be detected either from a sitemap entry in  a  robots.txt,
       or  when passed as a FILE-OR-URL argument in which case detection requires the urlset/sitemapindex tag to
       be within the first 70 characters of the sitemap. Compressed sitemap files are not supported.

PLUGINS

       There are two plugin types: connection and content plugins. Connection plugins are run after a successful
       connection to the URL host. Content plugins are run if the URL type has content  (mailto:  URLs  have  no
       content  for  example)  and  if  the  check  is  not  forbidden  (ie. by HTTP robots.txt). Use the option
       --list-plugins for a  list  of  plugins  and  their  documentation.  All  plugins  are  enabled  via  the
       linkcheckerrc(5) configuration file.

REKURSION

       Bevor  eine  URL  rekursiv  geprüft  wird,  hat  diese  mehrere  Bedingungen zu erfüllen. Diese werden in
       folgender Reihenfolge geprüft:

       1. Eine URL muss gültig sein.

       2. Der URL-Inhalt muss analysierbar sein. Dies beinhaltet zur Zeit HTML-Dateien, Opera  Lesezeichen,  und
          Verzeichnisse.  Falls  ein  Dateityp  nicht  erkannt  wird,  (zum  Beispiel  weil  er  keine  bekannte
          HTML-Dateierweiterung besitzt, und der Inhalt nicht nach HTML aussieht), wird  der  Inhalt  als  nicht
          analysierbar angesehen.

       3. Der  URL-Inhalt  muss  ladbar  sein.  Dies  ist  normalerweise der Fall, mit Ausnahme von mailto: oder
          unbekannten URL-Typen.

       4. Die  maximale  Rekursionstiefe  darf  nicht  überschritten  werden.  Diese   wird   mit   der   Option
          --recursion-level konfiguriert und ist standardmäßig nicht limitiert.

       5. Die  URL darf nicht in der Liste von ignorierten URLs sein. Die ignorierten URLs werden mit der Option
          --ignore-url konfiguriert.

       6. Das Robots Exclusion Protocol muss es erlauben, dass Verknüpfungen in der URL rekursiv verfolgt werden
          können. Dies wird geprüft, indem in den HTML Kopfdaten nach der "nofollow"-Direktive gesucht wird.

       Beachten Sie, dass die Verzeichnisrekursion alle Dateien in diesem  Verzeichnis  liest,  nicht  nur  eine
       Untermenge wie bspw. index.htm.

BEMERKUNGEN

       URLs  von  der  Kommandozeile  die  mit  ftp. beginnen werden wie ftp://ftp. behandelt, URLs die mit www.
       beginnen wie http://www.. Sie können auch lokale Dateien angeben. Falls sich Ihr System  automatisch  mit
       dem  Internet  verbindet  (z.B.  mit  diald), wird es dies tun wenn Sie Links prüfen, die nicht auf Ihren
       lokalen Rechner verweisen Benutzen Sie die Option --ignore-url, um dies zu verhindern.

       Javascript Links werden nicht unterstützt.

       Wenn Ihr System keine Threads unterstützt, deaktiviert diese LinkChecker automatisch.

       Sie können mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei angeben.

UMGEBUNG

       http_proxy
              gibt Standard HTTP Proxy an

       https_proxy
              specifies default HTTPS proxy server

       curl_ca_bundle
              an alternative certificate bundle to be used with an HTTPS proxy

       no_proxy
              kommaseparierte Liste von Domains, die nicht über einen Proxy-Server kontaktiert werden

       LC_MESSAGES, LANG, LANGUAGE
              gibt Ausgabesprache an

RÜCKGABEWERT

       Der Rückgabewert ist 2 falls

       • ein Programmfehler aufgetreten ist.

       Der Rückgabewert ist 1 falls

       • ungültige Verknüpfungen gefunden wurden oder

       • Warnungen gefunden wurden und Warnungen aktiviert sind

       Sonst ist der Rückgabewert Null.

LIMITIERUNGEN

       LinkChecker benutzt Hauptspeicher für jede zu prüfende URL, die in der Warteschlange steht. Mit tausenden
       solcher URLs kann die Menge des benutzten Hauptspeichers sehr groß werden. Dies könnte das Programm  oder
       sogar das gesamte System verlangsamen.

DATEIEN

       $XDG_CONFIG_HOME/linkchecker/linkcheckerrc - default configuration file

       $XDG_DATA_HOME/linkchecker/failures - default failures logger output filename

       linkchecker-out.TYP - Standard Dateiname der Logausgabe

SIEHE AUCH

       linkcheckerrc(5)

       https://docs.python.org/library/codecs.html#standard-encodings - gültige Ausgabe Enkodierungen

       https://docs.python.org/howto/regex.html - Dokumentation zu regulären Ausdrücken

AUTHOR

       Bastian Kleineidam <bastian.kleineidam@web.de>

COPYRIGHT

       2000-2016 Bastian Kleineidam, 2010-2024 LinkChecker Authors

10.4.0.post49+g7cf5037e                          August 27, 2024                                  LINKCHECKER(1)