版面精确还原的文本pdf电子书制作教程.docx
- 文档编号:4889117
- 上传时间:2023-05-07
- 格式:DOCX
- 页数:51
- 大小:2.09MB
版面精确还原的文本pdf电子书制作教程.docx
《版面精确还原的文本pdf电子书制作教程.docx》由会员分享,可在线阅读,更多相关《版面精确还原的文本pdf电子书制作教程.docx(51页珍藏版)》请在冰点文库上搜索。
版面精确还原的文本pdf电子书制作教程
一:
书籍封面的还原程度
书籍的封面无疑是书籍非常重要的要素,也是一本书的脸面,很大程度上吸引着书友的眼球。
ken777暂且根据自己的情况,对版面还原的文本PDF书籍的封面分成以下几种:
1.封面还原:
通过扫描、照相得到的高清晰的彩色封面,忠实原书。
(包括原有的一些缺陷,当然新书的漂亮封面更招人喜欢)(100%还原)。
比如:
2.封面修整:
原封面不够清晰、或封面脏污等进行了去斑点、去折痕、去黄底(颜色校正)、补缺损、图像扭曲、拉伸、重描线条、清晰化文字等修整操作的。
基本忠实原书(95%还原)。
如:
3.封面重绘:
没有原书、网上收集到原书封面图过小(比如读秀网上的),需要重新绘制的。
可能在色调、图案或某些细节方面与原书有差异。
如:
4.封面仿绘:
原因同上,重绘的话有些图片或素材不易搞到,干脆采用类似素材按原封面仿绘的。
线条图案简单的、做的好的话可能很漂亮,也可能与原书有较大差异。
如:
5.封面自绘:
实在找不到封面或原书干脆就没有封面的(比如杂志里的),那就可以根据书籍的内容,开动自己的艺术细胞,挥洒鼠标自行绘制。
比如:
当然,能有九成以上品相的原书、或者有大牛帮忙可以搞到读秀、超星高分辨率的原图当然更好,不过世间不如意者十之八九,这时候就看制书者的水平、用心了。
比如观者兄的《汉译世界学术名著丛书》的封面,左下角的标记真精致:
在读书中文网发自己制作的文本PDF书籍马上就要一年了。
前有观者、Biglu、逝者如斯兄以及诸位书友的大作引领,ken777做书水平一步一步在提高。
恰逢年底,略略总结一下,抛一小砖,希望能引出各位制书高手的和广大书友美玉来……!
二:
PDF书籍上的链接问题
“制书谈”之前的乱谈:
近日众书友点名建议开办“PDF文本制作讲习班”,ken777心有惴惴。
说实话,ken777并非计算机科班出身,也没在出版、印刷行业混过,只是喜欢看书、玩电脑而已,制作PDF图书完全是兴趣所致,再加上一点点“共享”心,想在网络上做一点事情。
做书确实水平有限,完全是属于“野狐禅”,胡乱琢磨,不成系统。
前日CTJ121兄发出的BigLu兄大作:
《制作版面还原的文本PDF的方法》才真正是系统的介绍,以此做教材,边看边练习,各位制书水平定会与时俱进。
ken777喜欢学些新东西充实自己,喜欢观摩各位高手的作品,当然随着书做多了也有所心得,愿意分享给大家,试着写一些零星“制书谈”供大家探讨。
满天冰雪:
“我把孔府藏书的word文件转化为PDF,有些PDF在页面内(不是书签那,是正文目录页那),点击目录标题,就能跳转到该页正文,有些则不能,一直弄不清楚其中奥妙。
”
冰雪兄提的上述问题实际上就是想在PDF书籍里设置链接,解决办法有两大类:
1、在word里做好页面链接,然后转换到PDF里面。
加入超链接:
·办法1.自动生成的:
用word自动功能添加目录、图表目录、交叉引用和书签:
预先在Word里设置好标题或者大纲级别、题注、自定义样式,用菜单项的“插入-->索引和目录”来进行。
这儿有很详细的介绍:
·办法2.手动添加指向各大纲级别的超级链接:
在目录(自己输入的目录)上,设置超链接,在对话框中选择各大纲的级别(适用于比较灵活、个性化的目录样式)。
·办法3.手动添加指向word书签的超级链接
在某页你指定的位置插入一个书签,并给书签取名,在其他要做超链接的位置上,设置超链接,在对话框中选择刚才的书签就可以了。
这儿有一图文并茂的介绍:
转换成PDF的链接:
许多PDF生成软件都可以在生成过程中转换链接,如果是AdobeAcrobatProfessional6以上的版本的话就好办了,转word为PDF时,不要用打印到AdobePDF的虚拟打印机,而用Word上的菜单“AdobePDF-->转换为AdobePDF”。
注意:
Word上的菜单“AdobePDF--更改转换设置”里,要将“添加链接到AdobePDF”选项打上勾:
2、在已经生成的pdf文件里面增添链接。
要是生成的PDF文件中忘记作链接,或者干脆就没有什么办?
其实,在ADOBEACROBATPRO中有好几种办法来增加超链接。
(以8.1版为例)
·办法1:
最简单办法:
手动选择文本添加超级链接:
先用“选择”工具
选定准备添加链接的一段文字(可以是目录,也可以是别的文字),点击鼠标右键,选择“创建链接”;
这时会弹出“创建链接”对话框,我们选择“跳至页面视图”,点“下一步”;
这时候,就可以翻到你想要去的页面(目标),然后单击“设置链接”;
可以用鼠标、键盘翻页,如果不方便的话,也可以点书签或在页面导览工具栏中直接输入页号到达目标。
这就设置完了。
这时,鼠标移到有链接的文字上面,光标会变成一只“手形”,点击就会到达目标处。
很简单吧!
·办法2:
利用“快照”工具
:
选择一个区域(不光是文本,图像或是空白地方都可以)然后创建链接:
后面的操作同办法1。
·办法3:
使用“链接工具”创建链接:
点工具-->高级工具-->链接工具(或选择“高级编辑”工具栏上的“链接工具”。
)
光标变成十字叉形(+)。
按下鼠标左键,使用光标画出您想要创建链接的区域:
松开鼠标左键,则又弹出“创建链接”对话框,设置好后,点下一步:
又可以选目标了。
·在设置链接时,还可以选择链接外观(是否可见、高亮状态、线条等)。
·其实,链接不光是本文档里可以跳至页面,也可以链接到别的文件、链接到网络地址;以及播放媒体、运行JavaScript等动作。
3、在pdf文件里面编辑链接:
点击“链接工具”后,文档中现存的链接,包括不可见链接,都暂时可见;
在要编辑的链接上单击鼠标右键,选择“编辑”就可以移动、复制、删除了;选择“属性”就可以更改外观、动作等,
4、删除链接:
以前下过几份PDF格式的资料,打开发现其中每页中间都有原来网站网址的超链接;字体很大,很碍眼,如果不小心点到链接,还会打开该网站的网页,很烦人。
这时候就要想法删除它们了。
·对于个别链接,可以用“链接工具”个别删除;
·想全部删除链接,可以从菜单选“高级-->文档处理-->删除所有链接”操作:
(对本坛某书友制作的全书加上了他自己的论坛ID加分链接,我就是这样处理的,嘿嘿!
)
用上述办法可以在PDF文档中建立/编辑各种链接。
比如,一本全图形扫描的大书,完全可以将目录页、索引页与正文全部作上链接,方便阅读。
网上流传的《实用内科学第12版》就是这样做的。
功德莫大焉。
链接的用处极大,水也很深,这里只介绍了简单的点滴,愿君共探之。
三:
时尚与苗条,文本PDF文件减肥初试
本来,本篇乱谈的起初标题是:
瞎鼓捣——“原汁原味”与“减肥”的折中。
又一想,时尚与苗条不就是这个问题的两面么。
由来:
对文本PDF我不是什么行内人士,仅仅是个爱好,写这篇文章的原因,一是因为想喜欢鼓捣,二是想给许多刚入巷的朋友简单介绍减肥的体会。
至于其它我是不曾顾及的。
正如文章的副标题一样:
瞎鼓捣——没有什么特别的讲究,只是鼓捣几下后扯上几句体会——
对普通读者而言,用PDF制作的文本电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,且可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。
但是随着电子书制作的越来越深入,发现PDF文档越来越大,急需“减肥”了,于是Ken777就选择了两个较大的例子进行了下面的试验(小文件就没必要了吧!
),说明中以ADOBEAcrobatPRO7为例。
样本情况:
文件样本1《从一到无穷大》自制,属于科技类书,格式较复杂,图文混排。
在word下由AdobeAcrobat7.0Professional(以下简称Acrobat7)采用字体嵌入、高质量打印设置转换生成,生成的PDF文件大小:
11383KB,B5尺寸,共315页。
原word文件7.45M,包括彩色JPG文件6幅,灰度JPG文件13幅,TIF黑白2值CCITT4压缩图片133幅,由内嵌公式编辑器生成的矢量图135幅,GIF透明图5幅以及16万字的字符。
文字采用宋体、黑体、华文仿宋、方正大标宋-GBK、华文楷体、Pmincho以及其他英文、符号字体。
文件样本2《超载》,由观者老兄制作,word转换生成,属于简单版式的小说书,包括彩色JPG文件2幅,GIF透明图2幅以及32万字的字符。
16开尺寸,共607页。
文字以华文中宋为主,采用字体嵌入。
先看看例子的文件统计数据:
用acrobat7打开例子文件,选择“高级”>“PDF优化器”来打开“PDF优化器”对话框;单击对话框顶部的“统计空间使用情况”按钮。
显示如下:
可见:
例子1图像占用最多,例子2文档额外开销占用最多。
二者字体占用也不少。
帮助文件说明:
在优化文件前,您最好统计文件空间使用情况来获取一份特定文档元素占用字节总数的报告,这些元素包括字体、图像、书签、表单、已命名目标和注释,还包括整个文件大小。
统计的结果包括元素占用空间的大小,以及在整个文件中所占的百分比。
空间统计结果可以告诉您减小文件大小的最佳方面。
初步“减肥”
Acrobat7减肥有三招:
第一招:
“另存为”--最简单的一招:
在菜单选“文件”>“另存为”再为你的文档换一个名字单击“确定”即可。
帮助文件说明:
“有时,您只需通过使用“另存为”命令便可以减小AdobePDF文件的大小。
本操作会重新保存文件,但不需要访问用于生成AdobePDF文件的源文件。
”
第二招:
“减小文件大小”--照方制作,家家俱备、老少咸宜的:
在菜单选“文件”(acrobat8在“文档”)>“减小文件大小”再选择您需要的兼容版本,然后单击“确定”。
(默认acrobat5.0)
帮助文件说明:
“您可以使用“减小文件大小”命令通过重新取样和重新压缩图像、解除嵌入字体、压缩文档结构以及整理元素,例如重复的背景图像和无效书签来尝试减小文件大小。
”
第三招:
“PDF优化器”:
好比跟着电视里“天天饮食”学做菜,看着简单,做好不容易:
菜单选“高级”>“PDF优化器”(最简单的路径),然后显示出一堆选项,我们先用其“标准设置”进行“减肥”。
帮助文件说明:
“PDF优化器提供了许多用于减小AdobePDF文件大小的设置。
是否使用所有设置取决于您使用文件的目的和文件自身的本质要求。
通常情况下,默认设置通过删除某些嵌入字体,压缩图像,以及从文件删除不再需要的项目来最大程度的优化存储空间。
”
三招各进行下来,我们看看减肥后的统计数据:
【例子1统计数据-另存】、
【例子1统计数据-优化】、
【例子1统计数据-减小】
【例子2统计数据-另存】、
【例子2统计数据-优化】、
【例子3统计数据-减小】
例子2最多减少了41.2%
成功了!
成了!
成……!
成……吗?
简单分析一下:
例子2:
文本为主,原始文件里“文档额外开销”占了38.81%,处理后基本上降到了5.5%左右,减少了2.5M左右,占了减肥“贡献度”的86%左右,而“另存”、“减小”、“优化”三法效果都差不多。
估计原始PDF文件经过多次编辑以后,留存有许多无用的“垃圾”。
例子1:
图文混排的,三种方法都没什么大作用,此文件是直接由word生成的,“垃圾”较少。
看来“减肥”大计要从“优化”的不同选项上着手了。
再次“减肥”
1:
对于例子1,首先从图片分辨率下手,将“缩减像素采样”改为如果大于225像素/英寸(DPI)就缩减为150DPI。
减肥效果明显,图像空间占用由9254490字节降为7200151字节,不过,显示效果呢?
看下图(用Acrobat7放大到400%观看):
【例子1图像效果1原始】、
【例子1图像效果1优化150DPI】
从中可以看出,对比原始图片,明显图像粗糙了许多(实际上100%观看还是可以接受的)。
2:
再次将“缩减像素采样”改为如果大于300DPI,就缩减为225DPI,图像效果就好多了。
【例子1图像效果1优化225DPI】
3:
那么黑白单色图像呢(这本书黑白图占了绝大多数)?
看下图,效果不理想:
【例子1图像效果2原始】、
【例子1图像效果2优化150DPI】
4:
再次将黑白图的“缩减像素采样”改为如果大于450DPI,就缩减为300DPI,效果良好。
【例子1图像效果2优化300DPI】
5:
对于例子1,然后从字体上考虑试试能否减少一些体积,取消了TinesNewRoman字体后,内封面字体明显变形。
见下图:
【例子1字体效果1原始】、
【例子1字体效果1优化字体变化】
6:
如果是“减少”“优化”两种方法联用呢?
ken777花了一点时间,对上面的几种方法、设置简单地组合试验了一遍,由于过程很繁琐,就不贴图显示具体过程了。
最后选定了一种自我感觉比较好的组合,最后文件尺寸如下:
【统计数据1优化不变字体-减小】
7:
另外,发现Acrobat7的“减少文件大小”效果似乎与“PDF优化器”当前默认选项有关,几次调整优化器选项后的出结果都不同。
初步结论:
1:
最基本的减肥方法就是“另存为”(改名),它可以清除文档中的不必要的项目,而不“损失”所需的要素。
建议所有的书友做成文档后都要进行这一步。
2:
“减少文件大小”操作相对不太复杂,个人觉得一般以文本为主的文档可以接受。
但它的选项是不多的,适用于通常网络传输、浏览和保存。
缺点是有时候部分内嵌字体会缺失,图像清晰度会下降(但是不影响阅读),但对于某些高要求(比如技术类的、古籍影印类、精品收藏类的)不太适合。
特别对于ken777标榜的“精确页面还原”不太合适,呵呵!
3:
使用PDF优化器:
它提供了很多选项,可以在保持文档视觉效果和文档体积大小之间做可控制的平衡,但选择比较多,有点让人无从选择(老虎吃刺猬,无从下口),需要高手指点或进行反复试验,但做好了确实挺理想。
建议:
(1)如果您只要得到一个简单的文本PDF文件,浏览其内容,完全不必搞的那么复杂,在生成PDF的时候,选择用“最小文件大小”即可。
(2)原始图像素材的分辨率很重要,我一般在保证图像显示质量的前提下,封面封底图像(彩色或灰度)尽可能选150DPI到300DPI,黑白单色图像尽可能选300DPI以上。
(3)生成PDF的软件也很多,兼容性不一,有的第三方软件生成的PDF文本经Acrobat7、8处理后面目全非,反之亦然。
因此,“减肥”处理前应当做好备份。
(4)PDF文件格式非常复杂,包罗万象、适用面极广,很多因素都会影响其尺寸的变化。
“减肥”得考虑文件中图像大小、分辨率,文件中是否嵌入字体、是否有隐藏的图层、用户数据、附件、表单以及预览项目,或者对某些网络传输、再编辑的兼容性等等方面以及PDF是否已经进行过优化综合考虑,也就是“原汁原味”与“减肥”的折中,才能做出理想的PDF文档!
(5)“减肥”要视文件使用的场合和文件的内容及重要性来进行,单纯片面追求“苗条”可能会引来不必要的麻烦。
说明:
Ken777接触Acrobat虽然很早,但制作中讲究格式、做文本PDF书还是近年的事,以上文字纯属一点心得、仅仅针对Word生成的PDF,还恳请各位PDF高手讨论、指正。
四:
锦上添花文本PDF的后期制作
经过了素材准备、文字输入(或OCR)、校对、排版、修整插图、制作封面等步骤之后,终于通过生成了自己的文本PDF,欣喜之余把玩一番之后是不是就可以传到论坛上分享给大家了?
且慢,俗话说:
“路行百里半九十”,还有一些后期整理活要干呐!
就像嫁女,咱们也得给您的文本PDF“化妆打扮一番”才能出门。
1.设置PDF初始视图(默认打开方式)
打开PDF图书,第一眼看到的就是初始视图,谁都希望自己的作品给人留下好的第一印象。
我一般设置成这样:
在打开PDF文件时,是将书签面板和正文同时打开;默认显示封面,放大率设置成“整页显示”或“默认”,页面布局是单页,标题栏显示标题。
在AcrobatProfessional8中,点选菜单“文件--》属性”或按“Ctrl-D”弹出“属性”选项卡,点选“初始视图”进行设置,见下图:
各种选项一目了然,可以按需要设置(比如设置成全屏幕打开文件,隐藏菜单栏、图表,一次打开双页并排显示等等)。
2.设置层次书签:
一本制作精良的PDF书,通常会加上便于读者阅读快速定位、跳转的书签,(这一点上,大多数超星书比较规范),如下图:
Ken777推荐书签根据书的内容以章节为主,分出层次,通常包括:
·封面+图书名(勒口有图书简介、作者简介等也可加上书签)
·书名页(内封、扉页)
·版权页
·前言(或序、导读、出版说明、凡例等正文前的说明文字)
·目录
·正文:
层次化的篇目书签(如:
篇、部、章、节等)
·附录(图表、注释、索引、参考文献等)
·后记(或跋、篇后语、译者注等)
·封底
·附加内容(比如原版书影、作者生平等您自己收集整理的内容)
·制作者说明(比如文字输入、校对说明、制作者信息、日期等等)
书签可以在制作格式文本时就设置好,由PDF转换软件自动生成;也可以在PDF生成后添加、编辑。
Acrobat7以上的转换功能对Word的大纲支持蛮好,但合并其他PDF文件后有时候书签指向会出错,要多检查、编辑。
删除不必要的次级标题。
Word转换PDF时,书签的级数取决于文档大纲级数,但有些次级标题在目录中是没有的,需要根据目录的实际情况加以修改。
组织书签时,可以删除书签标题中不必要的空格和脚注标志。
注意,加书签时按需要设置动作页面缩放比率,以免点击标签时图书页面忽大忽小;
加书签时可以设置书签的外观,如颜色、粗细等
书签文字多少、层次的深浅以便于阅读,显示一页以内为好(这也体现了层次书签折叠的好处),当然也不必全部照抄目录,对于文字复杂的可以适当简化。
书签编辑时,可以使用“拖拽”的办法设置各书签层次的逻辑关系,很是方便。
3.加上链接:
必要时,对于文本PDF可以发挥电子书的优势,在原书页的目录、脚注、尾注以及图表目录、交叉引用、E-mail、网址等处加上跳转链接,便于读者阅读和参阅。
比如,以前下过一个词典类PDF书,里面将各汉字字头与正文页面做成链接,使用起来异常方便。
·先加书签再加目录的页面链接会很容易。
4.编排分节页号
PDF文件是按页组织编排的,默认显示的是逻辑页码。
比如封面是(逻辑)第1页,书名页是第2页、版权页是第3页,目录是第4页,而正文第一页变成了(逻辑)第5页,此时在“页面导览”工具栏上显示的页码与正文页码不一致,此时直接输入正文页码,页面跳转不对。
使用起来有点不方便。
为了使PDF文件正文页码与原书(打印文件)一致,我们可以采用“编排页码”功能设计分节页号。
在Acrobat8的帮助中解释说:
“文档页面的页码并不总是与出现在缩略图下和“页面导览”工具栏里的页码相符。
页面用整数编排页码,从第1页开始文档的第一页,如此类推。
因为一些PDF文档可能包含扉页,如版权页面和目录,其正文页面可能不会遵循“页面导览”工具栏上显示的页码进行编排。
”
“您可以通过不同方法在您的文档中编排页码。
您可以对成组的页面指定不同的页码编排样式,例如,1、2、3,或i、ii、iii或a、b、c。
您也可以通过添加前缀来自定义页码编排系统。
例如,第1章可以编排为1-1、1-2、1-3等,第2章可编排为2-1、2-2、2-3等。
”
“当您为页面重新编号时,仅显示在“页面”面板和工具栏中的数字受影响。
”
我一般使用与书签相对应的分节页码,就是将页码分几节:
·封面、内封、版权页、前言、目录等使用文字前缀或罗马数字
·正文:
使用阿拉伯数字
·附录、后记、封底、附加内容、制作者说明等使用文字前缀
【编排页码的例子1】
【编排页码的例子2】
这样做优点是页码一目了然,可以在“页面导览”工具栏的页码框直接输入正文页码即可正确跳转。
【编排页码的例子3】
也可以仿照老马的Pdg2Pic与FreePic2Pdf配合,在PDF文件中所自动生成的三段页码:
封面、版权页用大写英文字母A、B、C;目录页用小写罗马字母i、ii、iii;正文页用阿拉伯数字1、2、3。
还见过一种编排法:
页码分正文前、正文、正文后、不占页插页,共四个页码区。
正文前使用i,ii,iii格式;正文使用1,2,3格式;正文后使用a,b,c,格式;不占页插页使用I,II,III,格式。
操作办法:
单击“页面”按钮,然后从“选项”菜单中选择“编排页码”;或者在选中页面缩图,在右键菜单里选择“编排页码”。
指定编号将应用到哪一页或哪几页
指定编号样式、前缀(如果有的话)以及起始编号
您也可以继续前一节的编码样式
从前往后顺序修改页码比较不容易乱。
5.添加详实的书籍信息:
一本制作精良的PDF书,不光是内容要好,还需要在PDF文件属性页里加入相关信息,便于检索(在浩如烟海的网络中尤其如此):
·书籍基本信息:
(就是CIP数据的内容)
·标题(Title)
·作者(Author)
·主题(Subject)(参考文件格式)
·关键字(Keywords)
·扩展信息:
(必要时可完善)
·丛书名
·书名原文(如果是翻译外文的书)
·译者、校者
·出版信息(出版社、日期、版次、印次、页数、ISBN号(书号)、中图法分类号等)
·本文件制作者。
6.添加制作者相关信息:
在一本辛苦制作的文本PDF书里加上自己的ID是惯例,也是负责任的体现。
ken77建议专门另辟一页记载这些内容(另行按模版制作,后期合成到PDF里):
·参与制作者的ID,联系方式(必要时)
·制作(修改)版次状态(一校、二校等)
·制作者主要工作:
如扫描、拍摄、OCR、校对、修图、绘图、排版等(必要时)
·版面还原程度(必要时)
·书籍制作的说明信息(如校对中原文错误、特殊排版的处理、繁难文字输入等)
·日期时间
·书稿来源(影印本、实体书、网络搜索得到等)
·感谢提供协助者
·参照情况等(必要时可添加)
·在成品PDF书在明显处上加上制作者标识,目前ken777是加本人印章,也可在书名页、版权页或尾页加上文字说明。
·必要时加上某论坛标识,以不占主封面为宜。
·声明:
现在版权愈来愈敏感,要是您觉得有必要,还是加上一些声明吧!
·免责声明
·版权声明(如果有的话)
·买正版书提示
7.文档安全性:
对于共享和加密,ken777也很矛盾,本来做电子书就是为了共享给大家,打个招呼转载也无妨,可是就是有那么一些“人”做法太过分,抹去原制作者的信息,厚颜加上自己的标记,声称本站原创,这也太……。
出于无奈加了文档修改口令,我也知道这种口令很容易破解,只不过给某些人加一点麻烦罢了!
但ken777觉得为便于读者使用,应该:
·允许图书内容复制、打印、批注。
·口令主要针对禁止修改、禁止提取、合并页面;
·口令应便于制作者记忆并有足够位数。
8.按需要对PDF文件“减肥”
修改多了PDF文件体积可能会膨胀,按需要进行(另存为、减小文件体积、文件优化)。
9.兼容性检查:
使用A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 版面 精确 还原 文本 pdf 电子书 制作 教程