Câu hỏi Làm thế nào tôi có thể xác định loại tệp mà không có phần mở rộng trên Windows?


Đôi khi tôi nhận được tệp từ khách hàng của tôi có phần mở rộng tệp sai. Ví dụ, tên là image.jpg nhưng tệp thực sự là hình ảnh TIFF. Trong nhiều trường hợp, tôi có thể làm rõ nó bằng cách mở tập tin trong một trình soạn thảo văn bản, nhìn vào vài byte đầu tiên, sau đó suy ra loại tệp nào.

Điều này làm việc cho tôi với các tệp JPEG, TIFF, GIF và PDF. Tuy nhiên có nhiều loại tệp khác ngoài đó.

Có thể tự động xác định loại tệp chính xác bằng cách phân tích dữ liệu chứa không?


145
2018-04-24 07:36


gốc


Đối với những người quan tâm file lệnh thực hiện điều này trên các máy * nix. - boehj
Câu hỏi rất hay! Một cái gì đó mà tôi đã bí mật muốn tất cả thời gian này, nhưng luôn luôn quên hỏi :) - pepoluan
Tôi không hiểu tại sao câu hỏi này lại không có chủ đề (sau 3 năm). Tôi không yêu cầu một phần mềm cụ thể (tôi đã viết lại câu hỏi của mình để nhấn mạnh điều này). Tôi chỉ cần một giải pháp. - Martin
Tôi không hiểu tại sao 26 người nghĩ rằng boehj * nix liên quan đến bình luận ở trên "thêm một cái gì đó hữu ích cho bài viết". Câu hỏi này được gắn thẻ windows, nhưng nhận xét ngụ ý: "Bạn không thể làm điều đó trên Windows, bạn phải sử dụng * nix thay thế". Vì thế? Nhận xét được hướng dẫn "cho những người quan tâm". Trong những gì? Thay đổi máy tính? :( - Aacini
@Aacini hữu ích cho những người * nix đến từ đây từ google. - jingyu9575


Các câu trả lời:


Bạn có thể dùng TrID công cụ có thư viện ngày càng tăng về định nghĩa loại tệp để xác định tệp.

Screenshot

Các ký tự đại diện được hỗ trợ, vì vậy trong ví dụ của bạn, bạn có thể đặt tất cả các hình ảnh được kiểm tra trong một thư mục, ví dụ: C: \ verifyimages - sau đó bạn có thể sử dụng lệnh:

trid C:\verifyimages\*

Điều này sẽ kiểm tra tất cả các tệp trong verifyimages thư mục.


Ngoài ra còn có một phiên bản GUI, TrIDNet:

Screenshot

Có tài liệu hướng dẫn về cách bạn có thể dễ dàng tích hợp TrID hoặc TrIDNet vào Windows Explorer và Total Commander:

Windows Explorer

Tổng chỉ huy


138
2018-04-24 07:47Lưu ý rằng nó cho biết nó không được cấp phép cho mục đích thương mại, chỉ sử dụng cá nhân - Chris Magnuson
Tôi đã gặp một số khó khăn trong việc tìm ra tệp tải xuống nào là cần thiết để sử dụng chương trình này. Vì vậy, nhận xét này là để hỗ trợ trong đó. Bạn sẽ cần tải xuống hai tệp. Đầu tiên, tiện ích dòng lệnh hoặc tiện ích GUI. Thứ hai, một thư mục các định nghĩa XML được gọi là "TrID XML defs". Đặt các tệp XML định nghĩa trong cùng thư mục với TrID. Sau đó quét định nghĩa. Cuối cùng, bạn có thể bắt đầu sử dụng nó. - mrtsherman


tập tin

Tập tin kiểm tra từng đối số trong một nỗ lực để phân loại nó. Có ba bộ kiểm tra, được thực hiện theo thứ tự sau: kiểm tra hệ thống tập tin, kiểm tra số phép thuật và kiểm tra ngôn ngữ. Các Đầu tiên kiểm tra thành công gây ra loại tệp được in.

Loại in thường sẽ chứa một trong các từ bản văn (tệp chỉ chứa các ký tự in và một vài ký tự điều khiển chung và có thể an toàn để đọc trên thiết bị đầu cuối ASCII), thực thi (tệp có chứa kết quả của việc biên dịch chương trình dưới dạng dễ hiểu đối với một số hạt nhân UNIX hoặc một chương trình khác), hoặc dữ liệu có nghĩa là bất cứ điều gì khác (dữ liệu thường là "nhị phân" hoặc không thể in được). Ngoại lệ là các định dạng tệp nổi tiếng (tệp lõi, lưu trữ tar) được biết là chứa dữ liệu nhị phân.


48
2018-04-24 07:38file là tiêu chuẩn, nhưng trên các hệ thống cũ hơn (đặc biệt là không phải Linux) không phải là rất am hiểu. Đối với Ubuntu, nó phải khá đáng kính và thậm chí được cài đặt như là tiêu chuẩn. - Thorbjørn Ravn Andersen
@Anm_LA, nó không phải là tiêu chuẩn ở tất cả trên Windows, nhưng liên kết trong câu trả lời là một cổng của phiên bản GNU của file cho Windows. Nếu các lệnh * nix khác thú vị đối với bạn với tư cách là người dùng Windows, thì hãy vuốt xung quanh trang web đó để tìm tất cả các loại đá quý. - RBerteig
Tôi rất nghi ngờ về điều đó file là một chuyên gia về các tệp được tạo bởi các ứng dụng Windows. - Robin Green
@Robin: Bạn được chào đón để thử nghiệm nó. - Ignacio Vazquez-Abrams
@Robin: Tôi rất nghi ngờ bạn đã sử dụng file ở tất cả, nhưng bạn gần như đã quyết định về hiệu quả của nó. - tzot


Tôi từng làm việc cho Thư viện Quốc gia Pháp, để xây dựng một hệ thống lưu trữ kỹ thuật số không chỉ chứa sách số hóa mà còn chứa hàng triệu đồ tạo tác kỹ thuật số với tất cả các loại tệp lạ. Chúng tôi đã sử dụng JHOVE để nhận dạng các định dạng tệp.

JHOVE là mã nguồn mở, nó được JSTOR và Thư viện Đại học Harvard duy trì. Nó khá đơn giản để sử dụng.


12
2018-04-24 13:16mát mẻ! nhưng nó có nhận ra các định dạng độc quyền như TrID không? anyways, tôi làm có một số sử dụng để xác định các định dạng con / biến thể của các định dạng không độc quyền (hoặc, chính xác, độc quyền 'mở rộng' sang định dạng chuẩn hóa), do đó, điều này sẽ có ích. cảm ơn bạn cho người đứng đầu! - pepoluan


tôi sử dụng Thư viện OutsideIn của Oracle trong các chương trình của tôi. Không miễn phí, nhưng chúng hoạt động tốt, đặc biệt là cho hình ảnh. Thị trường nói rằng nó hỗ trợ hơn 500 loại tệp.


1
2018-04-24 11:30

Bạn có thể kiểm tra loại tệp từ bất kỳ máy tính nào kể cả cửa sổ tại

http://www.checkfiletype.com


0
2018-06-04 11:24Chào mừng bạn đến với Super User! Xin vui lòng đọc cách giới thiệu phần mềm trong câu trả lời, đặc biệt là các bit trong Dũng cảm; sau đó chỉnh sửa câu trả lời của bạn để làm theo các hướng dẫn ở đó. Điều này áp dụng ngay cả khi bạn đang đề xuất một trang web! Chúc mừng - bertieb