---------续上文----------
注意:没登录论坛的朋友看不到图哦,只会显示代码如:[attach] 70221 [/attach]
前面 10 楼和 16 楼,我们提到了网页的源代码。下面接着 16 楼继续讲。
我们先来看一个小例子,
比如 www.nstone.com 这个网站,此网站例子之前福步别的版区有举例过。虽然找到的不是非常有用的邮箱地址,不过在此先做示例:
我们打开 contact us 页面:
http://www.nstone.com/index.php? ... tid=2&Itemid=85
可以发现这里有一个常见的需要填写的表单,表单中有一个“多重指向性”的下拉选框。
这时,你可以在表单的空白处右击鼠标右键,在弹出的右键菜单中选择“查看源文件/源代码”,这样会打开一个 TXT 的文本文件,
直接 CTRL+F。在弹出来的对话框内输入“@”或者"option value",确定。就可以查找到所有的邮箱。
<select name="to_location">
<option value="bfloyd@nstone.com">Memphis, TN</option>
<option value="bevin@nstone.com">Nashville, TN</option>
<option value="torr@nstone.com">Mobile, AL (Gulf Coast)</option>
<option value="September">Jackson, MS</option>
</select>
这里的 select 是网页制作的基本语言 HTML 中的下拉菜单的代码,option 是具体某个选项的代码。我们可以看到,我们发现了三个 email 地址:
bfloyd@nstone.com
bevin@nstone.com
torr@nstone.com
由于这是一个销售类型的公司,因此每个邮箱地址对应的实际是不同的区域的 sales 负责人的联系邮件。根据这个我们也可以推断,所有这个公司的员工包括老板可能邮箱都是 xxxx@nstone.com 的形式。
下面我们看另一个例子:
(声明:原先这里演示的一个真实的荷兰客户信息挖掘的内容,很意外地被客户得知了,要求删除公司的信息,因此这里的内容在原先的内容上做了删减。请大家谅解!)
有一家荷兰的公司(客户要求删除,网站截图已删除),主要做医疗和一次性用品。我们打开是的 CONTACT US 页面,发现是一个需要填写的表单,没有发现任何邮箱地址。
(注意:这个时候如果网页表单中没有”多重指向性“下拉选框,一般基本上不需要再看了。因为没有下拉选框的控件 select 和 option,基本不会隐藏指向性邮箱)
这里我们看到,在 ”E-Mail naar afdeling“的右边,有一个下拉选框:
我们大致看了一下,选择项如下:
Verkoop / Sales
PR & Communicatie
Inkoop / Purchasing
Export
Boekhouding / Bookkeeping
Kwaliteitsmanager / Quality manager
Directie / Management
我们看到了 Verkoop 和 Inkoop 这两个词,荷兰语(Dutch) 里分别是”销售“和”采购“的意思。注意,放入“荷兰语关键词学习文档里”。
看到 Inkoop 对应了 Purchasing,我们需要的就是它。下面查看这个网页的表单部分的源代码。查看一个网页的源代码有很多种方法。有的浏览器如火狐、搜狗、chrome 这些都支持鼠标右键菜单,“查看源文件”。
如果你是还用着 IE 这样的低效的浏览器,也可以在顶部菜单“查看(v)”中找到“源代码(c)”。 (源代码的英文是 source code 或者 code)
注意:有的时候网页用的是框架或者嵌套结构。那么你所看到的网页实际上并不是一个单一的页面,可能是两个或两个以上的网页组合或者嵌套而成。
这种情况下,鼠标右键点的位置不同,查看的是不同网页的源代码。好比你如果随便在网页的两侧空白处点查看源代码,那么可能看到的是整体框架而不是要填写的表单页面的源代码。
那么怎样判断一个网站是单独页面还是嵌套结构呢?有种很简单有效的办法,从网页的左边按住鼠标左键拖拉过整个网页时(阴影代表网页元素占据网页的位置),如果你看到表单那个位置是一个“整块区域”,那么这里就是嵌套结构,嵌套了一个单独的表单网页。如果是零散的阴影,则表明是整个 contact us 页面都是一个单独的页面,没有嵌套结构,比如之前的那个例子:
---------------------------------------------------------------------------------------------------------------------------
那个 www.nstone.com 的小例子,我们用鼠标从左向右拖,看看阴影区域:
这种分散的,不是整块的阴影区域,就说明没有嵌套结构,你只要在页面的任何一处点击右键查看源代码即可(不需要在表单区域内点击右键)
--------------------------------------------------------------------------------------------------------------------------------------------------------------
搜狗浏览器不提示网页结构,所以会直接显示“查看源文件”。你点了打开源文件之后直接搜索即可找到。
其他浏览器如火狐会有网站结构性的提示如“此框架”,那你就优先看这部分结构里的源代码即可。这时你要做的就是确保在这个表单的区域内(阴影范围内)点击鼠标右键。
这样会打开一个 TXT 的文本文件,直接 CTRL+F。在弹出来的对话框内输入“@”或者"option value",确定。就可以查找到所有的邮箱。现在我们来看看结果:
<option value="info@xxxxx.nl" selected>Selecteer een afdeling</option>
<option value="info@xxxxx.nl">Verkoop / Sales</option>
<option value="info@xxxxx.nl">PR & Communicatie</option>
<option value="purchase@xxxxx.nl">Inkoop / Purchasing</option>
<option value="info@xxxxx.nl">Export</option>
<option value="m.hordijk@xxxxx.nl">Boekhouding / Bookkeeping</option>
<option value="info@xxxxx.nl">Kwaliteitsmanager / Quality manager</option>
<option value="info@xxxxx.nl">Directie / Management</option>
PS:此处具体的网站和网址根据客户的要求已经做屏蔽处理。
可以看到。我们最需要的邮箱已经被找到。purchase@xxxxx.nl。
除此以外,还有 info 的邮箱,还有一个 m.hordijk@xxxxx.nl 的邮箱。这个看邮箱前面的账号,应该是个人名。名字应该是 Mxxxx Hordijk。
那么他可能是什么职务呢?这个人的邮箱对我们是否也很重要呢?会不会是什么 GM,CEO 或者 President 之类的高层呢?
我们继续利用 GOOGLE 翻译查看 Boekhouding。 Dutch --- English 得到结果:这个是 account,accounting 一类的,应该是财务方面的,可能是 CFO(财务经理或财务总监)。那么这个应该不是正确的人。[/email] 。
于是发现到的邮箱中,purchase 的权重最高,其次 INFO,其次财务部门m.hordijk@schinkelmedical.nl。
为什么 INFO 的权重要大于财务部门?你去你们公司财务部待个两天就知道了,财务部门到底有多忙。
对于有些朋友实践后说源文件中没有搜到邮箱,152 楼有原因分析,请注意仔细查看!
好了,这个例子中讲到了网页的表单中,发现有多重指向性下拉选框,进而我们利用查看源代码的方法找到隐藏的邮箱。
那么是不是网页上有表单,也有多重指向性下拉选框,就一定能找到隐藏邮箱呢?
不是。大概有 70-80%的几率是能查找到的。还有大概 20-30%的几率查找不到!比如我们看这个网站:
http://www.microflex.com/About-Microflex/Contact-Us
你也能看到一个需要填写的表单,和具有明确指向性的下拉选框。但是你查看源文件或源代码,查找"@" 就找不到邮箱。这个时候我们查找"option value",找到如下代码:
<option value="Product question">Product question</option>
<option value="Request Certificates of Analysis">Request Certificates of Analysis</option>
<option value="Request for information">Request for information</option>
<option value="Suggestion">Suggestion</option>
<option value="General Inquiry">General Inquiry</option>
<option value="Employment Opportunities">Employment Opportunities</option>
<option value="Other">Other</option>
可以看到,这里 value 后面是一些文字,而没有邮箱地址。
这是因为源代码中赋值、传递参数和逻辑判断的方式不一样。(如果你学过编程的基础的话,应该知道我说的赋值是什么意思。option value 本身就表示“选项的值”的意思。)
打个比方,在之前的那个例子中,网页的源码里,写代码的人员是直接把 purchase@xxxxx.nl 这个值
直接赋给 “Inkoop / Purchasing” 这个选项。这个也可以理解为直接赋值。就想当于: 选项 A=邮箱地址 (把邮箱地址赋值给 A),而且这句命令直接写在了网页里。
下面这个例子,是在网页的源码里,写代码的人员用了不同的变量来定义不同的选项(你可以理解为代号),并且不在这个网页中做出直接指向,而是递交到某个在你提交表单随后进行判断处理的网页,随后再递交。
比如:
如果你选了“Product question”, then 提交,然后在后台你看不见的地方,在一个判断程序的网页中,它可能会先进行分类,然后根据你选择了“Product question”,最后把你填写的内容指向销售部门或者产品经理的邮箱。 sales@microflex.com or xxx@microflex.com
这就好比多走了一个路径。因此你看不到源代码中的邮箱了。因为现在变成了 选项 A=某个代号。 如果你选中的是 A(某个代号),那么提交后先到后台一个判断的页面,来逻辑查询这个代号表达的意思和要指向的邮箱地址。因此,这种情况是不可能通过源代码找到邮箱的。
---------未完待续----------