我正在编写一个程序,它可以获取带有视频的网页的源代码。然后它使用正则表达式来隔离该视频的下载链接。那么它使用httpwebrequest和httpwebresponse下载视频。我的问题出现在某些网站有一个页面,您必须点击“继续”才能访问视频页面。如何使用获取html页面的源代码?
例如,有玩/view/s995xvc9e2fv视频名为“The.Matrix.Reloaded..mp4”所以我告诉我的程序,以获取链接“/view/s995xvc9e2fv”的源代码,但它无法找到视频的下载链接,因为它在“继续”页面的源代码中搜索文件。如果您转到上面的网站并查看源代码,则不会看到链接。然后,点击继续,当视频出现时执行相同操作,您会注意到该文件仅存在于第二个文件中。
如何获取播放视频的页面的源代码,而不是必须单击的页面继续?
我想使用此代码:
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
Dim Loading As String = "Loading..."
TextBox1.Text = Loading
Dim request As .HttpWebRequest = .HttpWebRequest.Create(TextBox2.Text)
Dim response As .HttpWebResponse = request.GetResponse()
Dim sr As System.IO.StreamReader = New System.IO.StreamReader(response.GetResponseStream())
Dim sourcecode As String = sr.ReadToEnd()
TextBox1.Text = sourcecode
End Sub
也许有一种方法可以自动选择“继续”按钮编程?
-04-28
daniel11
+1
我怀疑按钮有一些客户端的JavaScript,你将需要interperet。几乎好像作者不希望你这样做。 –
-04-28 12:16:56
+0
以及我怎么会得到实际上有它的视频页面,而不是继续页面的HTML源代码? –
-04-28 12:32:13
+1
当你点击它时,你必须做按钮的操作,但是这可能会被服务器端元素混淆。我无法提供一个通用答案,我不想点击您当前位置的链接。 –
-04-28 12:44:37