“ ”与nbsp;或“ ”
您好,我正在尝试使用Indesign提取的html代码编译EPUB v2.0。我注意到在段落开头或结尾处有很多“特殊字符”。例如“ ”与nbsp;或“ ”
<p class="text_indent0px font_size0_8em line_height1_325 margin_bottom1px margin_left0px margin_right0px sans_serif floatleft">E<span class="small_caps">VELYNE</span>	</p>
这是什么
	
,可以,我不是摆脱它或用替换“NBSP;”?
	
是选项卡的ascii代码。所以我猜这些段落是用制表符缩进的。
如果你想与
替换它们,然后用它们的4
你不能盲目地用四个不间断的空间替换它,它通常凝结到一个空间。 –
是用来表示一个非打破空间的空间是我们然后使用键盘的空格键
	
小数
 
十进制字符代码的实体水平标签的字符代码
和	
均r epresent空间但
是非换装置的多个顺序发生不会被折叠成一个,其中作为对于相同的情况下, `将折叠到一个空间
	
=约4
空间和约。 8  
空格
在HTML编码&#{number}
,{number}
是ascii码。因此,	
是一个选项卡,通常会将其浓缩为HTML中的一个空格,除非您使用CSS(或<pre>
标记)将其视为预格式化的文本。
因此,将其替换为非中断或常规空间是不安全的,除非您可以保证它不在任何位置显示为选项卡。
div:first-child {
white-space: pre;
}
<div>	 Test</div>
<div>	 Test</div>
<pre>	 Test</pre>
参见https://developer.mozilla.org/en-US/docs/Web/CSS/white-space和http://ascii.cl/
有使用四种类型的字符参考方案。
- 使用十进制字符代码(正则表达式模式:
&#[0-9]+;
), - 使用十六进制字符代码(正则表达式模式:
&#x[a-f0-9]+;
), - 使用命名的字符代码(正则表达式模式:
&[a-z]+;
), - 使用实际字符(正则表达式:
.
)。
这些转换都以相同的方式呈现。但是,编码风格是不同的。例如,如果你需要显示a latin small letter E with diaeresis
那么你可以使用任何以下公约:
-
ë
(十进制表示), -
ë
(十六进制格式) -
ë
(HTML标记), -
ë
(实际字符),
同样,就像你说的,应该用什么(一)	
(十进制表示法)或(b)
(html表示法)或(c) 
(十进制表示法)。因此,从上述类推,可以说(a),(b)和(c)是三种不同字符的三种不同的符号。
而且,这是你的信息,(a)是Horizontal Tab
,(b)的一个是non-breaking space
实际上 
是十进制和(c)是正常空格字符十进制数表示。
现在,技术上space
在段落的末尾,是没有意义的。更好的是,你可以放弃这些。如果您仍然需要使用里面的<pre>
元素,而不是<p>
或<div>
。
希望这有助于...
'' 是一个标签,它通常凝结到一个空间,HTML –
它是如何让意义上,有一个段落的结尾标签? –