• 大多数类型的信息可以很容易地访问网站,但也有可能不是一个互联网连接的无处不在。 这就是为什么在某些情况下,一个可下载网页离线导航,它可以非常有帮助的研究,特别是如果内容主要文本。 这也是目的Xidel,命令行的工具,用于提取的数据网页。

    应用来在一小包,并且没有设置参与。 它不与其自身的接口,并且需要使用从命令线路接口,这并不一定要启动有管理员权限。

    数据可以提取的帮助的几种模式匹配的模板,如属/XPath表,以及CSS3选择。 此外,它可以提取超过两HTTP及HTTPS连接,同时Xidel可以按照重定向,链接,以及先前提取价值观。

    各种开关可用于定义的进程,并帮助的命令显示所有可能的功能与相关的解释。 抽选项可以设置包含和排除的特殊字符串。 各种类型的项目可随后的周围网站和重定向。

    一个人可以选择使用代理服务器连接,通过HTTP,以及为包括附加头信息,或者等之间的请求。 XML和HTML是其中支持的出口的格式。

  • अधिकांश प्रकार की जानकारी आसानी से पहुँचा जा सकता वेब पर है, लेकिन वहाँ नहीं हो सकता है एक इंटरनेट कनेक्शन के साथ हर जगह. यह है क्यों कुछ मामलों में डाउनलोड कर सकते हैं एक पूरे वेब पृष्ठों ऑफ़लाइन नेविगेशन के लिए हो सकता है, जो अविश्वसनीय रूप से उपयोगी अनुसंधान के लिए, यदि विशेष रूप से सामग्री है, ज्यादातर पाठ है । यह भी उद्देश्य के Xidel, एक कमांड लाइन उपकरण के लिए डेटा निकालने से वेब पृष्ठों.

    आवेदन में आता है एक छोटे पैकेज है, और वहाँ कोई सेटअप शामिल है । यह नहीं है के साथ आते हैं, अपने स्वयं के इंटरफेस है, और जरूरत के लिए इस्तेमाल किया जा सकता से एक कमांड लाइन इंटरफेस है, जो जरूरी नहीं है होना करने के लिए शुरू कर दिया प्रशासक विशेषाधिकारों के साथ.

    डेटा निकाले जा सकते हैं की मदद के साथ कई पैटर्न-मेल टेम्पलेट्स, इस तरह के रूप में XQuery/XPath अभिव्यक्ति, के रूप में अच्छी तरह के रूप में सीएसएस 3 चयनकर्ताओं । इसके अलावा, यह संभव है निकालने के लिए दोनों HTTP और HTTPS कनेक्शन है, जबकि Xidel का पालन कर सकते हैं redirections, लिंक, और पहले से निकाले मूल्यों.

    विभिन्न स्विच कर सकते हैं इस्तेमाल किया जा करने के लिए प्रक्रिया को परिभाषित है, और मदद के आदेश को प्रदर्शित करता है के सभी संभव कार्यों के साथ संबंधित स्पष्टीकरण. निकासी विकल्प सेट किया जा सकता है शामिल करने के लिए और बाहर विशेष रूप से तार. विभिन्न प्रकार के आइटम हो सकता है पीछा के आसपास वेबसाइट और redirections.

    एक का चयन कर सकते हैं का उपयोग करने के लिए प्रॉक्सी कनेक्शन HTTP पर, के रूप में अच्छी तरह के रूप में शामिल करने के लिए अतिरिक्त हैडर जानकारी, या इंतजार अनुरोधों के बीच है । XML और HTML के बीच रहे हैं समर्थित निर्यात प्रारूपों ।

  • Most types of info can be easily accessed over the web, but there might not be an Internet connection everywhere. This is why in some cases one can download entire web pages for offline navigation, which can be incredibly helpful for research, especially if content is mostly text. This is also the purpose of Xidel, a command line tool for extracting data from web pages.

    The application comes in a small package, and there’s no setup involved. It doesn’t come with its own interface, and needs to be used from a command line interface, which doesn’t necessarily have to be started with administrator privileges.

    Data can be extracted with the help of several pattern-matching templates, such as XQuery/XPath expressions, as well as CSS 3 selectors. Moreover, it’s possible to extract over both HTTP and HTTPS connections, while Xidel can follow redirections, links, and previously extracted values.

    Various switches can be used to define the process, and the help command displays all possible functions with related explanations. Extraction options can be set to include and exclude particular strings. Various types of items can be followed around the website and redirections.

    One can choose to use Proxy connections over HTTP, as well as to include additional header info, or wait between requests. XML and HTML are among the supported export formats.