  1. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
  2. <html xmlns="http://www.w3.org/1999/xhtml">
  3. <head>
  4. <meta http-equiv="Content-Type" content="text/html; charset=<?php echo $cfg_soft_lang; ?>">
  5. <title>新增采集节点</title>
  6. <link href="css/base.css" rel="stylesheet" type="text/css" />
  7. <script language="javascript" type="text/javascript" src="js/co.js"></script>
  8. <style type="text/css">
  9. <!--
  10. .STYLE2 {color: #666666}
  11. -->
  12. </style>
  13. </head>
  14. <body>
  15. <div class="bodytitle" style="width:98%">
  16. <div class="bodytitleleft"></div>
  17. <div class="bodytitletxt" style="padding-left:10px;" ><b>新增采集节点:第一步设置基本信息及网址索引页规则</b></div>
  18. <div style='float:right;padding-right:6px;padding-top:3px'>
  19. <input type="button" name="b" value="返回节点管理页" class="coolbg np" style="width:110px;height:20px;" onclick="location.href='co_main.php';" />
  20. </div>
  21. </div>
  22. <form name="form1" method="post" action="co_add.php">
  23. <input type='hidden' name='channelid' value='<?php echo $channelid; ?>' />
  24. <input type='hidden' name='step' value='2' />
  25. <input type='hidden' name='dopost' value='test' />
  26. <table width="98%" border="0" cellpadding="3" cellspacing="1" bgcolor="#D6D6D6" align="center">
  27. <tr>
  28. <td background="images/tbg.gif" bgcolor="#F2F6E5">
  29. <table width="400" border="0" cellspacing="0" cellpadding="0">
  30. <tr class="top" onClick="showHide('sitem');" style="cursor:pointer">
  31. <td width="26" align="center"><img src="images/file_tt.gif" width="7" height="8"></td>
  32. <td width="374"><b>节点基本信息</b><a name="d1"></a></td>
  33. </tr>
  34. </table>
  35. </td>
  36. </tr>
  37. <tr id="sitem">
  38. <td bgcolor="#FFFFFF" width="100%">
  39. <table width="100%" border="0" cellpadding="2" cellspacing="2">
  40. <tr>
  41. <td width="18%" height="24">节点名称:</td>
  42. <td width="32%"><input name="notename" type="text" id="notename" style="width:250px" /></td>
  43. <td width="18%">目标页面编码:</td>
  44. <td width="32%">
  45. <input type="radio" name="sourcelang" id='language1' class="np" value="gb2312" checked='1' />
  46. GB2312
  47. <input type="radio" name="sourcelang" id='language2' class="np" value="utf-8" />
  48. UTF8
  49. <input type="radio" name="sourcelang" id='language3' class="np" value="big5" />
  50. BIG5
  51. </td>
  52. </tr>
  53. <tr>
  54. <td height="24">区域匹配模式:</td>
  55. <td>
  56. <input type="radio" class="np" name="macthtype" value="regex" />
  57. 正则表达式
  58. <input name="macthtype" class="np" type="radio" value="string" checked='1' />
  59. 字符串
  60. </td>
  61. <td>内容导入顺序:</td>
  62. <td>
  63. <input type="radio" name="cosort" id="cosort1" value="asc" class='np' checked='1' />
  64. 与目标站一致
  65. <input type="radio" name="cosort" id="cosort2" class='np' value="desc" />
  66. 与目标站相反
  67. </td>
  68. </tr>
  69. <tr>
  70. <td height="24" colspan="4" bgcolor="#FBFCE2"><img src="images/file_tt.gif" width="7" height="8" />以下选项仅在开启防盗链模式才需设定,如果目标网站没有防盗链功能请不要开启,否则会降低采集速度。</td>
  71. </tr>
  72. <tr>
  73. <td height="24">防盗链模式:</td>
  74. <td>
  75. <input name="isref" type="radio" class="np" value="no" checked='1' />
  76. 不开启
  77. <input name="isref" type="radio" class="np" value="yes" />
  78. 开启
  79. </td>
  80. <td>资源下载超时时间:</td>
  81. <td>
  82. <input name="exptime" type="text" id="exptime" value="10" size="3" />秒
  83. </td>
  84. </tr>
  85. <tr>
  86. <td height="24">引用网址:</td>
  87. <td colspan="3">
  88. <input name="refurl" type="text" id="refurl" value="http://" size="30" style='width:250px' />
  89. (一般为目标网站其中一个文章页的网址)
  90. </td>
  91. </tr>
  92. </table>
  93. </td>
  94. </tr>
  95. <tr>
  96. <td background="images/tbg.gif" bgcolor="#F2F6E5">
  97. <table width="400" border="0" cellspacing="0" cellpadding="0">
  98. <tr class="top" onClick="showHide('slist');" style="cursor:pointer">
  99. <td width="26" align="center"><img src="images/file_tt.gif" width="7" height="8"></td>
  100. <td width="374"><b>列表网址获取规则</b></td>
  101. </tr>
  102. </table></td>
  103. </tr>
  104. <tr id="slist">
  105. <td bgcolor="#FFFFFF">
  106. <table width="100%" border="0">
  107. <tr>
  108. <td width="18%" height="24">来源属性:</td>
  109. <td>
  110. <input type="radio" name="sourcetype" id="source1" class='np' onclick="selSourceSet()" value="batch" checked="checked" />
  111. 批量生成列表网址
  112. <input type="radio" name="sourcetype" id="source2" class='np' onclick="selSourceSet()" value="hand" />
  113. 手工指定列表网址
  114. <input type="radio" name="sourcetype" id="source3" class='np' onclick="selSourceSet()" value="rss" />
  115. 从RSS中获取
  116. </td>
  117. </tr>
  118. <tr bgcolor="#F7FCB4" id="rssset" style="display:none">
  119. <td height="24" bgcolor="#F4FCCB">RSS网址:</td>
  120. <td bgcolor="#F4FCCB">
  121. <input type="text" name="rssurl" id="rssurl" style="width:350px" value="http://" />
  122. <input type="button" name="btv2" id="btv2" value="测试" onclick="testRss()" />
  123. </td>
  124. </tr>
  125. <tr bgcolor="#FBFCE2" id="batchset">
  126. <td height="77">批量生成地址设置:</td>
  127. <td>
  128. <table width="90%">
  129. <tr>
  130. <td width="100%" colspan="2">
  131. 匹配网址:
  132. <input type="text" name="regxurl" id="regxurl" style="width:350px" value="http://" />
  133. <input type="button" name="btv1" id="btv1" value="测试" onclick="testRegx()" />
  134. </td>
  135. </tr>
  136. <tr>
  137. <td colspan="2">
  138. <span class="STYLE2">(如:http://www.dedecms.com/html/test/list_(*).html,如果不能匹配所有网址,可以在手工指定网址的地方输入要追加的网址) </span> </td>
  139. </tr>
  140. <tr>
  141. <td colspan="2">
  142. (*)从
  143. <input type="text" name="startid" id="startid" style="width:30px" value="1" />
  144. <input type="text" name="endid" id="endid" style="width:30px" value="" />
  145. (页码或规律数字)&nbsp;
  146. 每页递增:
  147. <input type="text" name="addv" id="addv" style="width:30px" value="1" />
  148. <input type="checkbox" name="usemore" id="usemore" class="np" value="1" onClick="testMore()" />
  149. 启用多栏目通配(#)
  150. </td>
  151. </tr>
  152. </table>
  153. </td>
  154. </tr>
  155. <tr id='handset'>
  156. <td height="171">手工指定网址:<br />
  157. <span class="STYLE2">在指定了通配规则后有些不能匹配的网址也可以在这里指定。</span><br /></td>
  158. <td><textarea name="addurls" id="addurls" cols="45" rows="5" style="width:80%;height:160px"></textarea></td>
  159. </tr>
  160. <tr id='usemoretr' style="display:none">
  161. <td height="171">多栏目通配规则:<br />
  162. <span class="STYLE2">
  163. 如果目标网站使用单一模板,可以在匹配网址中用"(#)"表示近似网址的差异,然后在通配规则中设定集合,并且可以指定导出栏目。
  164. </span>
  165. <br />
  166. </td>
  167. <td>
  168. <textarea name="batchrule" id="batchrule" cols="45" rows="5" style="width:80%;height:160px"></textarea>
  169. <br /><span style='color:#666666'>格式为:“[(#)=通配字符串; (*)=num-num; typeid=num]换行”
  170. <br />例如:[(#)=>labs/list_3; (*)=>1-25; typeid=>7] 匹配网址:http://www.aaa.com/(#)_(*).html</span>
  171. </td>
  172. </tr>
  173. </table>
  174. </td>
  175. </tr>
  176. <tr>
  177. <td background="images/tbg.gif" bgcolor="#F2F6E5">
  178. <table width="400" border="0" cellspacing="0" cellpadding="0">
  179. <tr class="top" onClick="showHide('arturl');" style="cursor:pointer">
  180. <td width="26" align="center"><img src="images/file_tt.gif" width="7" height="8"></td>
  181. <td width="374"><b>文章网址匹配规则</b></td>
  182. </tr>
  183. </table></td>
  184. </tr>
  185. <tr id="arturl">
  186. <td height="76" valign="top" bgcolor="#FFFFFF">
  187. <table width="100%">
  188. <!-- //使用与正则匹配链接模式不大稳定,也不适合初级用户,暂时作为保留项 -->
  189. <tr style='display:none'>
  190. <td width="18%">内容网址匹配模式:</td>
  191. <td width="82%">
  192. <input name="urlrule" type="radio" class="np" id="urlrule1" value="area" onclick="selUrlRuleSet()" checked="checked" />
  193. 指定包含有文章网址的区域(可以获取区域的网址、标题、图片等信息)
  194. <input type="radio" name="urlrule" id="urlrule2" value="regx" onclick="selUrlRuleSet()" class="np" />
  195. 指定网址正则表达式(仅能获得网址信息) </td>
  196. </tr>
  197. <tr id="regxruletr" style='display:none'>
  198. <td height="84">网址的正则表达式:</td>
  199. <td><textarea name="regxrule" id="regxrule" cols="45" rows="5" style="width:80%;height:60px"></textarea></td>
  200. </tr>
  201. <tr id="arearuletr">
  202. <td height="84">包含有文章网址的区域设置:</td>
  203. <td>
  204. <table width="90%">
  205. <tr>
  206. <td width="22%" align="center">区域开始的HTML:</td>
  207. <td width="78%">
  208. <textarea name="areastart" id="areastart" cols="45" rows="5" style="width:80%;height:60px"></textarea>
  209. </td>
  210. </tr>
  211. <tr>
  212. <td align="center">区域结束的HTML:</td>
  213. <td>
  214. <textarea name="areaend" id="areaend" cols="45" rows="5" style="width:80%;height:60px"></textarea>
  215. </td>
  216. </tr>
  217. <tr>
  218. <td align="center">如果链接中含有图片:</td>
  219. <td>
  220. <input name="listpic" type="radio" class='np' id="listpic1" value="0" />
  221. 不处理
  222. <input type="radio" name="listpic" id="listpic2" class='np' value="1" checked="checked" />
  223. 采集为缩略图
  224. </td>
  225. </tr>
  226. <tr>
  227. <td rowspan="2" align="center">对区域网址进行再次筛选:<br />
  228. (使用正则表达式)</td>
  229. <td>必须包含:
  230. <input type="text" name="musthas" id="musthas" style="width:280px" />
  231. (优先级高于后者)</td>
  232. </tr>
  233. <tr>
  234. <td>不能包含:
  235. <input type="text" name="nothas" id="nothas" style="width:280px" /></td>
  236. </tr>
  237. </table>
  238. </td>
  239. </tr>
  240. </table>
  241. </td>
  242. </tr>
  243. <tr>
  244. <td height="94" align="center" bgcolor="#FFFFFF">&nbsp;
  245. <input type="submit" name="b12" value="保存信息并进入下一步设置" class="coolbg np" style="width:200px" /> </td>
  246. </tr>
  247. </table>
  248. </form>
  249. </body>
  250. </html>