Câu hỏi Làm cách nào để so sánh sự khác biệt giữa hai tệp PDF trên Windows?


Bạn có biết cách tốt để so sánh các tệp PDF song song và hiển thị các sửa đổi giữa hai tệp này không?

Tôi đang tìm phần mềm Windows để thực hiện việc này. Nó sẽ là tuyệt vời nếu bạn có thể đăng cả hai sản phẩm miễn phí và không miễn phí.


187


gốc


Liên quan: stackoverflow.com/questions/145657/… - Epaga
Có một thư viện MIỄN PHÍ để so sánh điểm ảnh pdf theo pixel. Kiểm tra blog này: testautomationguru.com/… - Vinoth S


Các câu trả lời:


Thử WinMerge với xdocdiff cắm vào. Cả hai đều hoàn toàn miễn phí. Không có chuỗi đính kèm.


Một vài ý kiến ​​dưới đây cho thấy họ không thấy bất kỳ sự khác biệt nào. Điều đó có nghĩa là trình cắm không được cài đặt đúng cách. Dưới đây là cách thực hiện:

  1. Đặt các tệp ở nơi xdocdiff tập tin readme của plugin nói để đặt chúng (có hai nơi; tôi sẽ không liệt kê chúng ở đây vì tên tệp có thể thay đổi, v.v. - đọc readme)

  2. Trong WinMerge, vào Plugins> List và đánh dấu vào hộp kiểm "Enable Plugins" (bước này bị thiếu trong xdocdiff readme)

  3. Trong WinMerge, chọn Plugins> Automatic Unpacking (điều này đã bị vô hiệu hóa trước bước 2)

Sau đó, khi so sánh, bạn sẽ thấy những gì trông giống như các tập tin văn bản trong các cửa sổ so sánh.


98



Đã thử điều này nhưng không thể thấy bất kỳ sự khác biệt nào khi không sử dụng plugin xdocdiff. Có một tùy chọn để chọn trong giao diện người dùng của WinMerge không? - Umber Ferrule
Mục đích của việc xem văn bản nhị phân trong một tệp PDF là gì? Tôi hy vọng sẽ thấy sự khác biệt về hình ảnh được thực hiện bởi iC net PDFC. - JJD
Có cách nào để làm cho cột xử lý này bị hỏng không? Nếu không có nó, một sự thay đổi sẽ đổ vào một số. - Stuart
Plugins > List and tick the "Enable Plugins" checkbox là những gì đã mất tích đối với tôi! - Seph
Nhiều ký tự bị thiếu trong các phiên bản văn bản của các tệp PDF được hiển thị trong các cửa sổ khác nhau của WinMerge - cja


Trên Linux và Windows, bạn có thể sử dụng diffpdf (khác với diff-pdf đã đề cập trong chủ đề này).

enter image description here

Trên Ubuntu cài đặt bằng:

sudo apt-get install diffpdf

Xem thêm trang UbuntuGeek này để so sánh pds văn bản hoặc trực quan.

Cho cửa sổ, phiên bản Diffpdf Windows này hoạt động thực sự tuyệt vời. Bạn có thể tải xuống từ http://soft.rubypdf.com/software/diffpdf (cuộn xuống Phiên bản tĩnh Win32).


163



Tên riêng là DiffPDF (như đã thấy trong ảnh chụp màn hình) và nó dựa trên thư viện Qt 4 và Poppler, do đó nó Là di động. Xem trang chủ DiffPDF: qtrac.eu/diffpdf.html. Thông tin về Windows xây dựng là ở đây: soft.rubypdf.com/software/diffpdf. Và hướng dẫn cài đặt của bạn cũng hoạt động trên Debian. - przemoc
Trang chủ DiffPDF hiện có các liên kết cho Linux, trình cài đặt Windows và Mac DMG cài đặt.qtrac.eu/diffpdf.html). - studgeek
DiffPDF là công cụ tiên tiến nhất được trình bày ở đây, theo ý kiến ​​của tôi. Nó không chỉ cung cấp một so sánh đồ họa tốt đẹp, nhưng nó theo dõi những thay đổi khéo léo hơn những người khác, ví dụ: xdocdiff cho WinMerge. Tuy nhiên, nó có một vấn đề nghiêm trọng: Nó giới hạn so sánh với các trang. Điều đó có nghĩa, nếu bạn có một số văn bản trên trang 2 của tài liệu A, nhưng văn bản này chuyển đến trang 3 trong tài liệu B, thì công cụ cho rằng nó đã biến mất trong A và được thêm vào B. - caw
Bạn có thể tìm thấy các phiên bản miễn phí cũ hơn đây - Shafik Yaghmour
Tôi đã thử sử dụng nó cho một cuốn tiểu thuyết mà tôi xuất sang PDF. Thật không may là công cụ bị mất dấu vết sau khoảng 10 trang và coi mọi thứ là "khác", mặc dù các đoạn lớn là chính xác như nhau. - Eric J.


Gần đây tôi đã tìm thấy điều này và tôi thích nó.

https://github.com/vslavik/diff-pdf

Nền tảng chéo, miễn phí và hoạt động tốt.

Đây là ảnh chụp màn hình của diff-pdf trong hành động - lưu ý rằng văn bản không khác trong PDF, nhưng chỉ có phông chữ (và tương ứng, cài đặt bố cục):

diff-pdf.png

Cuộc gọi để có được hình ảnh đó là:

diff-pdf --view testA.pdf testB.pdf

... nơi testA.pdf / testB.pdf thu được bằng cách biên dịch tệp Latex đơn giản này pdflatex (phù hợp với mỗi pdf, xem bình luận):

\documentclass[12pt]{article}


                        % without mathpazo: testA.pdf
\usepackage{mathpazo} % with mathpazo: testB.pdf
\usepackage{lipsum}


\title{A brand new test}
\author{Testulio}

\begin{document}

\maketitle

\lipsum[1-3]

\end{document}

36



Chỉ một lưu ý nữa về diff-pdf: DiffPDF là một lựa chọn tuyệt vời để so sánh trực quan nhanh về mặt hình ảnh của văn bản đã thay đổi, nhưng thực tế là không thể gỡ lỗi các nội dung như, thay đổi nhỏ trong khoảng cách dòng - diff-pdf mặt khác, về cơ bản đặt nội dung trang từ cả hai tệp được so sánh trên cùng một trang (nhưng có màu sắc khác nhau) - vì vậy các vấn đề về khoảng cách dòng có thể dễ dàng được xác định ... Chúc mừng! - sdaau
Điều đó thật tuyệt! Có anyway để theo dõi tiến độ trên các tập tin lớn khi xuất ra một tập tin PDF (không sử dụng tùy chọn --view)? Các tùy chọn tiết / v dường như không làm bất cứ điều gì. Ngoài ra khi bạn chạy lệnh để tạo ra một so sánh PDF nó chạy trong một quá trình riêng biệt để nó không tạm dừng dấu nhắc lệnh như bình thường xảy ra khi bạn thực hiện một cái gì đó từ dấu nhắc. - LukeS
Đây là thứ tôi cần. Tôi đang so sánh các báo cáo PDF về thực thi số, vì vậy tôi đang tìm sự khác biệt trong một chữ số trong toàn bộ trang. Vấn đề là, tôi không thể xác định các nhân vật cyan, nhưng biết nơi khác biệt là, là đủ để tìm thấy nó trong các báo cáo ban đầu. - manuelvigarcia


Chúng tôi cũng cần so sánh các tệp PDF tại công ty của chúng tôi và không hài lòng với bất kỳ giải pháp nào mà chúng tôi đã tìm thấy, vì vậy chúng tôi đã thực hiện các giải pháp của riêng mình: iC net PDFC. Nó không miễn phí, nhưng chúng tôi cung cấp bản dùng thử 30 ngày.

Nó được viết bằng Java, vì vậy nó là nền tảng chéo.

screenshot

Điều gì làm cho nó đặc biệt là nó so sánh nội dung như trái ngược với chỉ văn bản (hoặc chỉ chuyển đổi pdf sang một hình ảnh và so sánh hình ảnh). Nó cũng có một công cụ so sánh trực quan đẹp mắt.


21



Đẹp bit của phần mềm. - Umber Ferrule
Tôi không thể làm việc này được. Tải hai tập tin và nhấp vào nút so sánh và không có gì xảy ra. - Craig Fisher
Xử lý đúng sự khác biệt giữa trang. Có chức năng xuất / in. Các cấu hình so sánh khác nhau (bao gồm cả tùy chỉnh). Chuột qua cung cấp cho bạn thêm chi tiết về những gì đã thay đổi. Trông rất tuyệt. Hạn chế là thử nghiệm / chi phí và không xử lý di chuyển. Chắc chắn vượt trội so với các công cụ cao hơn bình chọn IMO. - Jonathan Gawrych
@ JonathanGawrych cảm ơn vì những lời tốt bụng! Ý bạn là gì bởi "di chuyển", chính xác? Có lẽ chúng ta có thể thêm chức năng đó ... - Epaga
@Epaga Nếu một phần văn bản được chuyển từ trang này sang trang khác, nó sẽ được hiển thị dưới dạng xóa và bổ sung. Ví dụ: so sánh các đề xuất c ++ N4663 và N4680. Xem xung quanh trang 19, một ví dụ được chuyển từ đoạn 11 đến 8, tuy nhiên nó được coi là một sự bổ sung / xóa. Để thấy sự khác biệt thực sự, người ta cần phải tự phát hiện một cái gì đó được di chuyển, sau đó sao chép ví dụ này sang một công cụ khác để thấy rằng mọi thứ đã được thêm vào ví dụ (unhandled_exception, return_void, v.v.) - Jonathan Gawrych


Bạn cũng có thể sử dụng Adobe Acrobat X. Nó đã được xây dựng trong chức năng so sánh PDF trong "Xem -> So sánh tài liệu.


12



Acrobat hoặc Acrobat Reader? phần mềm Reader không có - Jason S
AcrobatX Pro là phiên bản duy nhất có tính năng này. Các "chỉ đơn giản AcrobatX" không. - Carl Witthoft
Trong Acrobat 9 Pro, nó nằm trong menu Document. - svinto
adobe.com/products/acrobat/file-compare-two-pdf-files.html - Iman Abidi


Tôi muốn thực hiện điều này (các tệp PDF khác) gần đây với các yêu cầu sau:

  • bỏ qua khoảng trắng, ngắt dòng, ngắt trang, v.v.
  • dễ dàng nhìn thấy khi chỉ là một vài từ đã thay đổi, không chỉ toàn bộ dòng / đoạn văn.
  • màu đầu ra diff

Tôi đã cài đặt pdftotext, wdiff và colordiff, có sẵn trong các trình quản lý gói khác nhau. (Với macports: sudo port install poppler wdiff colordiff)

Sau đó:

wdiff <(pdftotext old.pdf -) <(pdftotext new.pdf -) | colordiff

Bây giờ tôi có thể thấy những từ nào, màu sắc đẹp, đã thay đổi.

Biết thêm chi tiết: http://philfreo.com/blog/how-to-view-a-color-diff-of-text-from-two-pdfs/

Biến thể:

Sử dụng dwdiff có thể tạo ra kết quả tốt hơn một chút.

Tôi cũng muốn đầu ra HTML để kịch bản nhỏ này làm cho một trang web cơ bản với một chút CSS.

bash pc-script.bash old.pdf new.pdf > q.htlm

Sau đó mở q.html với trình duyệt web của bạn.

pc-script.bash tập tin:

#!/bin/bash

OLD="$1"
NEW="$2"

cat <<EOF
<html><head><meta charset="UTF-8"/><title>Changes from $OLD to $NEW</title></head><style>
.plus  { color: green; background: #E7E7E7;                                }
.minus { color: red;   background: #D7D7D7; text-decoration: line-through; }
</style><body><h1>Changes from [ <span class="minus">$OLD</span> ] to [ <span class="plus">$NEW</span> ]</h1><pre>
EOF

dwdiff -i -A best -P      \
  --start-delete='<span class="minus">' --stop-delete='</span>' \
  --start-insert='<span class="plus" >' --stop-insert='</span>' \
  <( pdftotext -enc UTF-8 -layout "$OLD" - )   \
  <( pdftotext -enc UTF-8 -layout "$NEW" - )   \

cat <<EOF
</pre></body></html>
EOF

Một ví dụ về đầu ra có thể được nhìn thấy đây


8





Nếu bạn đang so sánh văn bản bên trong một pdf, thì Vượt so sánh thực hiện điều này.

Không miễn phí, nhưng có ba mươi ngày dùng thử.


7



Vâng, New > Text Compare đã giúp tôi thấy sự khác biệt cơ bản trong văn bản giữa 2 tệp PDF. - Ryan


Công cụ tuyệt vời và dễ sử dụng: So sánh-It v4 (từ http://www.grigsoft.com/)

So sánh nhiều loại tệp khác nhau. Nó có một số bộ chuyển đổi tích hợp, bao gồm một cho các tệp PDF.

Tôi đã sử dụng nó một vài lần với kết quả thỏa mãn.

Thực sự nên thử điều này. Phiên bản dùng thử cho phép so sánh với thời gian không giới hạn.


6



Đây là điều tốt nhất và dễ nhất cho tôi. Cảm ơn! - Ankur Jain
Công cụ dễ nhất và đơn giản nhất mà tôi đã sử dụng. Tôi ước tôi có thể upvote điều này nhiều hơn một lần! - Chad
Đối với PDF, việc so sánh dường như là văn bản. Lần phát hành cuối cùng vào năm 2010. Bạn có thể trả tiền cho nó nhưng chắc chắn sự khác biệt là gì - tôi không thấy bất kỳ hạn chế nào? - Zitrax


Không biết điều đó, nhưng cũng có comparePDF (không miễn phí, nhưng có thể dùng thử 30 ngày): http://www.compare-pdf.com/download.htm


2





Ở đây bạn có thể tải lên hai bản pdf và lấy lại bản pdf và sẽ hiển thị cho bạn sự khác biệt giữa hai.

Hoạt động trên tất cả các nền tảng, không có gì học hoặc cài đặt và miễn phí.

https://synodins.com/apps/pdf_difference/intro.html


1