Чи є простий інструмент Bash, який дозволяє швидко виводити базовий HTML?


38

Час від часу мені потрібно робити просте завдання, коли я вивожу основний HTML в консоль. Я хотів би, щоб це було мінімально винесено, щоб було легше читати з першого погляду. Чи є утиліта, яка може обробляти основний HTML-рендерінг в оболонці (подумайте про рендеринг стилю Lynx - але не власне браузер)?

Наприклад, іноді я розміщую сторінку watchApache mod_status:

watch -n 1 curl http://some-server/server-status

Вихід сторінки - HTML з деякою мінімальною розміткою, яка відображається в оболонці на зразок:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html><head>
<title>Apache Status</title>
</head><body>
<h1>Apache Server Status for localhost</h1>

<dl><dt>Server Version: Apache/2.2.22 (Ubuntu) PHP/5.3.10-1ubuntu3.15 with Suhosin-Patch</dt>
<dt>Server Built: Jul 22 2014 14:35:25
</dt></dl><hr /><dl>
<dt>Current Time: Wednesday, 19-Nov-2014 15:21:40 UTC</dt>
<dt>Restart Time: Wednesday, 19-Nov-2014 15:13:02 UTC</dt>
<dt>Parent Server Generation: 1</dt>
<dt>Server uptime:  8 minutes 38 seconds</dt>
<dt>Total accesses: 549 - Total Traffic: 2.8 MB</dt>
<dt>CPU Usage: u35.77 s12.76 cu0 cs0 - 9.37% CPU load</dt>
<dt>1.06 requests/sec - 5.6 kB/second - 5.3 kB/request</dt>
<dt>1 requests currently being processed, 9 idle workers</dt>
</dl><pre>__W._______.....................................................
................................................................
................................................................
................................................................
</pre>
<p>Scoreboard Key:<br />
"<b><code>_</code></b>" Waiting for Connection,
"<b><code>S</code></b>" Starting up,
"<b><code>R</code></b>" Reading Request,<br />
"<b><code>W</code></b>" Sending Reply,
"<b><code>K</code></b>" Keepalive (read),
"<b><code>D</code></b>" DNS Lookup,<br />
"<b><code>C</code></b>" Closing connection,
"<b><code>L</code></b>" Logging,
"<b><code>G</code></b>" Gracefully finishing,<br />
"<b><code>I</code></b>" Idle cleanup of worker,
"<b><code>.</code></b>" Open slot with no current process</p>
<p />

При перегляді в Lynx той же HTML відображається як: Apache Status (p1 of 2) Status Apache Server for localhost

   Server Version: Apache/2.2.22 (Ubuntu) PHP/5.3.10-1ubuntu3.15 with Suhosin-Patch
   Server Built: Jul 22 2014 14:35:25
     ________________________________________________________________________________________________________

   Current Time: Wednesday, 19-Nov-2014 15:23:50 UTC
   Restart Time: Wednesday, 19-Nov-2014 15:13:02 UTC
   Parent Server Generation: 1
   Server uptime: 10 minutes 48 seconds
   Total accesses: 606 - Total Traffic: 3.1 MB
   CPU Usage: u37.48 s13.6 cu0 cs0 - 7.88% CPU load
   .935 requests/sec - 5088 B/second - 5.3 kB/request
   2 requests currently being processed, 9 idle workers

_C_______W_.....................................................
................................................................
................................................................
................................................................

   Scoreboard Key:
   "_" Waiting for Connection, "S" Starting up, "R" Reading Request,
   "W" Sending Reply, "K" Keepalive (read), "D" DNS Lookup,
   "C" Closing connection, "L" Logging, "G" Gracefully finishing,
   "I" Idle cleanup of worker, "." Open slot with no current process

2
Не bashзовсім так, але перевірити Xiki , він робить це і багато іншого
aarosil

Xiki виглядає приголомшливо.
MountainX

Відповіді:


50

lynxмає режим "скидання", який ви можете використовувати watch:

$ watch lynx https://www.google.com -dump

скріншот виводу

Від man lynx:

   -dump  dumps  the  formatted  output  of  the default document or those
          specified on  the  command  line  to  standard  output.   Unlike
          interactive mode, all documents are processed.  This can be used
          in the following way:

          lynx -dump http://www.subir.com/lynx.html

          Files specified on the command line are  formatted  as  HTML  if
          their  names  end  with one of the standard web suffixes such as
          “.htm or “.html”.  Use the -force_html option to  format  files
          whose names do not follow this convention.

У цього питання Ask Ubuntu є багато інших варіантів.


2
рись чудова. це також дуже корисний інструмент, коли ваш зв’язок дуже поганий, і вам потрібно зайти на перевірку сайту на наявність чогось - жодних зображень, скриптів чи css не можна зробити швидким завантаженням сторінки
jammypeach


8

Є щонайменше дві програми з назвою html2text( 1 ) ( 2 ), які виконують цю роботу.


Дійсно, але - якщо є можливість - вихід w3mнабагато красивіший. для таблиць.
Suuuehgi

5

elinksтакож є -dumpрежим

elinks -dump https://www.google.com

Дивіться також, linksна чому elinksбазується.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.