Ruby on Rails: HTML auslesen (parsen)

Mittels Ruby on Rails HTML Content parsen und bestimmte Werte/Informationen aus einem HTML Dokument oder einer Webseite auslesen. Bei dem Parsen einer Webseite ist selbstverständlich die Voraussetzung, dass es erlaubt ist bzw. das es für das auslesen nicht vielleicht schon eine API gibt.

Zum auslesen der Informationen innerhalb des HTML Dokuments wird die Ruby on Rails Erweiterung Nokogiri genutzt. Nokogiri kann HTML, XML, SAX, und Reader parsen. Dabei wird für die Suche XPath oder ein CSS3 Selector genutzt.
Continue reading