国内流行的内容管理系统(CMS)多端全媒体解决方案 https://www.dedebiz.com
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

270 lines
13KB

  1. <!DOCTYPE html
  2. PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
  3. <html xmlns="http://www.w3.org/1999/xhtml">
  4. <head>
  5. <meta http-equiv="Content-Type" content="text/html; charset=<?php echo $cfg_soft_lang; ?>">
  6. <title>新增采集节点</title>
  7. <link href="css/base.css" rel="stylesheet" type="text/css" />
  8. <script language="javascript" type="text/javascript" src="js/co.js"></script>
  9. <style type="text/css">
  10. <!--
  11. .STYLE2 {
  12. color: #666666
  13. }
  14. -->
  15. </style>
  16. </head>
  17. <body>
  18. <div class="bodytitle" style="width:98%">
  19. <div class="bodytitleleft"></div>
  20. <div class="bodytitletxt" style="padding-left:10px;"><b>新增采集节点:第一步设置基本信息及网址索引页规则</b></div>
  21. <div style='float:right;padding-right:6px;padding-top:3px'>
  22. <input type="button" name="b" value="返回节点管理页" class="coolbg np" style="width:110px;height:20px;"
  23. onclick="location.href='co_main.php';" />
  24. </div>
  25. </div>
  26. <form name="form1" method="post" action="co_add.php">
  27. <input type='hidden' name='channelid' value='<?php echo $channelid; ?>' />
  28. <input type='hidden' name='step' value='2' />
  29. <input type='hidden' name='dopost' value='test' />
  30. <table width="98%" border="0" cellpadding="3" cellspacing="1" bgcolor="#D6D6D6" align="center">
  31. <tr>
  32. <td background="images/tbg.gif" bgcolor="#F2F6E5">
  33. <table width="400" border="0" cellspacing="0" cellpadding="0">
  34. <tr class="top" onClick="showHide('sitem');" style="cursor:pointer">
  35. <td width="26" align="center"><img src="images/file_tt.gif" width="7" height="8"></td>
  36. <td width="374"><b>节点基本信息</b><a name="d1"></a></td>
  37. </tr>
  38. </table>
  39. </td>
  40. </tr>
  41. <tr id="sitem">
  42. <td bgcolor="#FFFFFF" width="100%">
  43. <table width="100%" border="0" cellpadding="2" cellspacing="2">
  44. <tr>
  45. <td width="18%" height="24">节点名称:</td>
  46. <td width="32%"><input name="notename" type="text" id="notename" style="width:250px" /></td>
  47. <td width="18%">目标页面编码:</td>
  48. <td width="32%">
  49. <input type="radio" name="sourcelang" id='language1' class="np" value="gb2312" checked='1' />
  50. GB2312
  51. <input type="radio" name="sourcelang" id='language2' class="np" value="utf-8" />
  52. UTF8
  53. <input type="radio" name="sourcelang" id='language3' class="np" value="big5" />
  54. BIG5
  55. </td>
  56. </tr>
  57. <tr>
  58. <td height="24">区域匹配模式:</td>
  59. <td>
  60. <input type="radio" class="np" name="macthtype" value="regex" />
  61. 正则表达式
  62. <input name="macthtype" class="np" type="radio" value="string" checked='1' />
  63. 字符串
  64. </td>
  65. <td>内容导入顺序:</td>
  66. <td>
  67. <input type="radio" name="cosort" id="cosort1" value="asc" class='np' checked='1' />
  68. 与目标站一致
  69. <input type="radio" name="cosort" id="cosort2" class='np' value="desc" />
  70. 与目标站相反
  71. </td>
  72. </tr>
  73. <tr>
  74. <td height="24" colspan="4" bgcolor="#FBFCE2"><img src="images/file_tt.gif" width="7"
  75. height="8" />以下选项仅在开启防盗链模式才需设定,如果目标网站没有防盗链功能请不要开启,否则会降低采集速度。</td>
  76. </tr>
  77. <tr>
  78. <td height="24">防盗链模式:</td>
  79. <td>
  80. <input name="isref" type="radio" class="np" value="no" checked='1' />
  81. 不开启
  82. <input name="isref" type="radio" class="np" value="yes" />
  83. 开启
  84. </td>
  85. <td>资源下载超时时间:</td>
  86. <td>
  87. <input name="exptime" type="text" id="exptime" value="10" size="3" />秒
  88. </td>
  89. </tr>
  90. <tr>
  91. <td height="24">引用网址:</td>
  92. <td colspan="3">
  93. <input name="refurl" type="text" id="refurl" value="http://" size="30" style='width:250px' />
  94. (一般为目标网站其中一个文章页的网址)
  95. </td>
  96. </tr>
  97. </table>
  98. </td>
  99. </tr>
  100. <tr>
  101. <td background="images/tbg.gif" bgcolor="#F2F6E5">
  102. <table width="400" border="0" cellspacing="0" cellpadding="0">
  103. <tr class="top" onClick="showHide('slist');" style="cursor:pointer">
  104. <td width="26" align="center"><img src="images/file_tt.gif" width="7" height="8"></td>
  105. <td width="374"><b>列表网址获取规则</b></td>
  106. </tr>
  107. </table>
  108. </td>
  109. </tr>
  110. <tr id="slist">
  111. <td bgcolor="#FFFFFF">
  112. <table width="100%" border="0">
  113. <tr>
  114. <td width="18%" height="24">来源属性:</td>
  115. <td>
  116. <input type="radio" name="sourcetype" id="source1" class='np' onclick="selSourceSet()" value="batch"
  117. checked="checked" />
  118. 批量生成列表网址
  119. <input type="radio" name="sourcetype" id="source2" class='np' onclick="selSourceSet()" value="hand" />
  120. 手工指定列表网址
  121. <input type="radio" name="sourcetype" id="source3" class='np' onclick="selSourceSet()" value="rss" />
  122. 从RSS中获取
  123. </td>
  124. </tr>
  125. <tr bgcolor="#F7FCB4" id="rssset" style="display:none">
  126. <td height="24" bgcolor="#F4FCCB">RSS网址:</td>
  127. <td bgcolor="#F4FCCB">
  128. <input type="text" name="rssurl" id="rssurl" style="width:350px" value="http://" />
  129. <input type="button" name="btv2" id="btv2" value="测试" onclick="testRss()" />
  130. </td>
  131. </tr>
  132. <tr bgcolor="#FBFCE2" id="batchset">
  133. <td height="77">批量生成地址设置:</td>
  134. <td>
  135. <table width="90%">
  136. <tr>
  137. <td width="100%" colspan="2">
  138. 匹配网址:
  139. <input type="text" name="regxurl" id="regxurl" style="width:350px" value="http://" />
  140. <input type="button" name="btv1" id="btv1" value="测试" onclick="testRegx()" />
  141. </td>
  142. </tr>
  143. <tr>
  144. <td colspan="2">
  145. <span
  146. class="STYLE2">(如:http://wwws.dedebiz.com/html/test/list_(*).html,如果不能匹配所有网址,可以在手工指定网址的地方输入要追加的网址)
  147. </span> </td>
  148. </tr>
  149. <tr>
  150. <td colspan="2">
  151. (*)从
  152. <input type="text" name="startid" id="startid" style="width:30px" value="1" />
  153. <input type="text" name="endid" id="endid" style="width:30px" value="" />
  154. (页码或规律数字)&nbsp;
  155. 每页递增:
  156. <input type="text" name="addv" id="addv" style="width:30px" value="1" />
  157. <input type="checkbox" name="usemore" id="usemore" class="np" value="1" onClick="testMore()" />
  158. 启用多栏目通配(#)
  159. </td>
  160. </tr>
  161. </table>
  162. </td>
  163. </tr>
  164. <tr id='handset'>
  165. <td height="171">手工指定网址:<br />
  166. <span class="STYLE2">在指定了通配规则后有些不能匹配的网址也可以在这里指定。</span><br /></td>
  167. <td><textarea name="addurls" id="addurls" cols="45" rows="5" style="width:80%;height:160px"></textarea>
  168. </td>
  169. </tr>
  170. <tr id='usemoretr' style="display:none">
  171. <td height="171">多栏目通配规则:<br />
  172. <span class="STYLE2">
  173. 如果目标网站使用单一模板,可以在匹配网址中用"(#)"表示近似网址的差异,然后在通配规则中设定集合,并且可以指定导出栏目。
  174. </span>
  175. <br />
  176. </td>
  177. <td>
  178. <textarea name="batchrule" id="batchrule" cols="45" rows="5" style="width:80%;height:160px"></textarea>
  179. <br /><span style='color:#666666'>格式为:“[(#)=通配字符串; (*)=num-num; typeid=num]换行”
  180. <br />例如:[(#)=>labs/list_3; (*)=>1-25; typeid=>7] 匹配网址:http://www.aaa.com/(#)_(*).html</span>
  181. </td>
  182. </tr>
  183. </table>
  184. </td>
  185. </tr>
  186. <tr>
  187. <td background="images/tbg.gif" bgcolor="#F2F6E5">
  188. <table width="400" border="0" cellspacing="0" cellpadding="0">
  189. <tr class="top" onClick="showHide('arturl');" style="cursor:pointer">
  190. <td width="26" align="center"><img src="images/file_tt.gif" width="7" height="8"></td>
  191. <td width="374"><b>文章网址匹配规则</b></td>
  192. </tr>
  193. </table>
  194. </td>
  195. </tr>
  196. <tr id="arturl">
  197. <td height="76" valign="top" bgcolor="#FFFFFF">
  198. <table width="100%">
  199. <!-- //使用与正则匹配链接模式不大稳定,也不适合初级用户,暂时作为保留项 -->
  200. <tr style='display:none'>
  201. <td width="18%">内容网址匹配模式:</td>
  202. <td width="82%">
  203. <input name="urlrule" type="radio" class="np" id="urlrule1" value="area" onclick="selUrlRuleSet()"
  204. checked="checked" />
  205. 指定包含有文章网址的区域(可以获取区域的网址、标题、图片等信息)
  206. <input type="radio" name="urlrule" id="urlrule2" value="regx" onclick="selUrlRuleSet()" class="np" />
  207. 指定网址正则表达式(仅能获得网址信息) </td>
  208. </tr>
  209. <tr id="regxruletr" style='display:none'>
  210. <td height="84">网址的正则表达式:</td>
  211. <td><textarea name="regxrule" id="regxrule" cols="45" rows="5" style="width:80%;height:60px"></textarea>
  212. </td>
  213. </tr>
  214. <tr id="arearuletr">
  215. <td height="84">包含有文章网址的区域设置:</td>
  216. <td>
  217. <table width="90%">
  218. <tr>
  219. <td width="22%" align="center">区域开始的HTML:</td>
  220. <td width="78%">
  221. <textarea name="areastart" id="areastart" cols="45" rows="5"
  222. style="width:80%;height:60px"></textarea>
  223. </td>
  224. </tr>
  225. <tr>
  226. <td align="center">区域结束的HTML:</td>
  227. <td>
  228. <textarea name="areaend" id="areaend" cols="45" rows="5" style="width:80%;height:60px"></textarea>
  229. </td>
  230. </tr>
  231. <tr>
  232. <td align="center">如果链接中含有图片:</td>
  233. <td>
  234. <input name="listpic" type="radio" class='np' id="listpic1" value="0" />
  235. 不处理
  236. <input type="radio" name="listpic" id="listpic2" class='np' value="1" checked="checked" />
  237. 采集为缩略图
  238. </td>
  239. </tr>
  240. <tr>
  241. <td rowspan="2" align="center">对区域网址进行再次筛选:<br />
  242. (使用正则表达式)</td>
  243. <td>必须包含:
  244. <input type="text" name="musthas" id="musthas" style="width:280px" />
  245. (优先级高于后者)</td>
  246. </tr>
  247. <tr>
  248. <td>不能包含:
  249. <input type="text" name="nothas" id="nothas" style="width:280px" /></td>
  250. </tr>
  251. </table>
  252. </td>
  253. </tr>
  254. </table>
  255. </td>
  256. </tr>
  257. <tr>
  258. <td height="94" align="center" bgcolor="#FFFFFF">&nbsp;
  259. <input type="submit" name="b12" value="保存信息并进入下一步设置" class="coolbg np" style="width:200px" /> </td>
  260. </tr>
  261. </table>
  262. </form>
  263. </body>
  264. </html>