लिनक्स में कमांड लाइन का उपयोग करके एक पीडीएफ फ़ाइल को संपादन योग्य पाठ में कैसे परिवर्तित करें

लिनक्स में कमांड लाइन का उपयोग करके एक पीडीएफ फ़ाइल को संपादन योग्य पाठ में कैसे परिवर्तित करें
लिनक्स में कमांड लाइन का उपयोग करके एक पीडीएफ फ़ाइल को संपादन योग्य पाठ में कैसे परिवर्तित करें
Anonim
कई कारण हैं कि आप पीडीएफ फाइल को संपादन योग्य टेक्स्ट में क्यों परिवर्तित करना चाहते हैं। हो सकता है कि आपको पुराने दस्तावेज़ को संशोधित करने की आवश्यकता हो और आपके पास सब कुछ पीडीएफ संस्करण है। विंडोज़ में पीडीएफ फाइलों को कनवर्ट करना आसान है, लेकिन अगर आप लिनक्स का उपयोग कर रहे हैं तो क्या होगा?
कई कारण हैं कि आप पीडीएफ फाइल को संपादन योग्य टेक्स्ट में क्यों परिवर्तित करना चाहते हैं। हो सकता है कि आपको पुराने दस्तावेज़ को संशोधित करने की आवश्यकता हो और आपके पास सब कुछ पीडीएफ संस्करण है। विंडोज़ में पीडीएफ फाइलों को कनवर्ट करना आसान है, लेकिन अगर आप लिनक्स का उपयोग कर रहे हैं तो क्या होगा?

कोई चिंता नहीं। हम आपको दिखाएंगे कि पीडीएफटीटीएक्स नामक कमांड लाइन टूल का उपयोग करके पीडीएफ फाइलों को संपादन योग्य टेक्स्ट में आसानी से कैसे परिवर्तित किया जाए, जो कि "पॉपप्लर-यूटिल" पैकेज का हिस्सा है। यह उपकरण पहले से ही स्थापित हो सकता है। यह जांचने के लिए कि क्या आपके सिस्टम पर pdftotext स्थापित है, टर्मिनल विंडो खोलने के लिए "Ctrl + Alt + T" दबाएं। प्रॉम्प्ट पर निम्न आदेश टाइप करें और "एंटर" दबाएं।

dpkg –s poppler-utils

नोट: जब हम इस आलेख में कुछ टाइप करने के लिए कहते हैं और टेक्स्ट के चारों ओर उद्धरण हैं, तो उद्धरण टाइप न करें, जब तक कि हम अन्यथा निर्दिष्ट न करें।

यदि pdftotext स्थापित नहीं है, तो प्रॉम्प्ट पर निम्न आदेश टाइप करें और "एंटर" दबाएं।
यदि pdftotext स्थापित नहीं है, तो प्रॉम्प्ट पर निम्न आदेश टाइप करें और "एंटर" दबाएं।

sudo apt-get install poppler-utils

संकेत मिलने पर अपना पासवर्ड टाइप करें और "एंटर" दबाएं।

पीडीएफ को विभिन्न प्रारूपों में परिवर्तित करने, पीडीएफ फाइलों में हेरफेर करने और फ़ाइलों से जानकारी निकालने के लिए पॉपप्लर-यूटिल पैकेज में कई टूल उपलब्ध हैं।
पीडीएफ को विभिन्न प्रारूपों में परिवर्तित करने, पीडीएफ फाइलों में हेरफेर करने और फ़ाइलों से जानकारी निकालने के लिए पॉपप्लर-यूटिल पैकेज में कई टूल उपलब्ध हैं।
पीडीएफ फ़ाइल को एक संपादन योग्य पाठ फ़ाइल में परिवर्तित करने के लिए निम्न मूलभूत आदेश निम्न है। टर्मिनल विंडो खोलने के लिए "Ctrl + Alt + T" दबाएं, प्रॉम्प्ट पर कमांड टाइप करें और "एंटर" दबाएं।
पीडीएफ फ़ाइल को एक संपादन योग्य पाठ फ़ाइल में परिवर्तित करने के लिए निम्न मूलभूत आदेश निम्न है। टर्मिनल विंडो खोलने के लिए "Ctrl + Alt + T" दबाएं, प्रॉम्प्ट पर कमांड टाइप करें और "एंटर" दबाएं।

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

अपनी मूल पीडीएफ फाइल के स्थान और नाम के अनुरूप प्रत्येक फ़ाइल में पथ बदलें और जहां आप परिणामस्वरूप टेक्स्ट फ़ाइल को सहेजना चाहते हैं। साथ ही, अपनी फाइलों के नामों के अनुरूप फ़ाइल नाम बदलें।

पाठ फ़ाइल बनाई गई है और इसे खोला जा सकता है जैसे आप लिनक्स में कोई अन्य टेक्स्ट फ़ाइल खोलेंगे।
पाठ फ़ाइल बनाई गई है और इसे खोला जा सकता है जैसे आप लिनक्स में कोई अन्य टेक्स्ट फ़ाइल खोलेंगे।
परिवर्तित टेक्स्ट में उन स्थानों में लाइन ब्रेक हो सकते हैं जिन्हें आप नहीं चाहते हैं। पीडीएफ फ़ाइल में पाठ की प्रत्येक पंक्ति के बाद लाइन ब्रेक डाले जाते हैं।
परिवर्तित टेक्स्ट में उन स्थानों में लाइन ब्रेक हो सकते हैं जिन्हें आप नहीं चाहते हैं। पीडीएफ फ़ाइल में पाठ की प्रत्येक पंक्ति के बाद लाइन ब्रेक डाले जाते हैं।

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

यदि आप केवल पीडीएफ फाइल में पृष्ठों की एक श्रृंखला को कन्वर्ट करना चाहते हैं, तो उस श्रेणी में पहले और आखिरी पृष्ठों को निर्दिष्ट करने के लिए "-f" और "-l" (लोअरकेस "एल") झंडे का उपयोग करें, जिन्हें आप कनवर्ट करना चाहते हैं।
यदि आप केवल पीडीएफ फाइल में पृष्ठों की एक श्रृंखला को कन्वर्ट करना चाहते हैं, तो उस श्रेणी में पहले और आखिरी पृष्ठों को निर्दिष्ट करने के लिए "-f" और "-l" (लोअरकेस "एल") झंडे का उपयोग करें, जिन्हें आप कनवर्ट करना चाहते हैं।

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

किसी पीडीएफ फ़ाइल को कनवर्ट करने के लिए जो मालिक पासवर्ड से सुरक्षित और एन्क्रिप्ट किया गया है, "-opw" ध्वज का उपयोग करें (ध्वज में पहला अक्षर एक लोअरकेस अक्षर "ओ" है, शून्य नहीं)।
किसी पीडीएफ फ़ाइल को कनवर्ट करने के लिए जो मालिक पासवर्ड से सुरक्षित और एन्क्रिप्ट किया गया है, "-opw" ध्वज का उपयोग करें (ध्वज में पहला अक्षर एक लोअरकेस अक्षर "ओ" है, शून्य नहीं)।

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

परिवर्तित होने वाली मूल पीडीएफ फ़ाइल को सुरक्षित रखने के लिए इस्तेमाल किए गए "पासवर्ड" को बदलें। सुनिश्चित करें कि एकल पासवर्ड हैं, दो बार नहीं, "पासवर्ड" के आसपास।

यदि पीडीएफ फ़ाइल सुरक्षित है और उपयोगकर्ता पासवर्ड से एन्क्रिप्ट किया गया है, तो "-opw" ध्वज के बजाय "-upw" ध्वज का उपयोग करें। बाकी का आदेश वही है।
यदि पीडीएफ फ़ाइल सुरक्षित है और उपयोगकर्ता पासवर्ड से एन्क्रिप्ट किया गया है, तो "-opw" ध्वज के बजाय "-upw" ध्वज का उपयोग करें। बाकी का आदेश वही है।
आप परिवर्तित टेक्स्ट पर लागू होने वाले एंड-ऑफ-लाइन वर्ण का प्रकार भी निर्दिष्ट कर सकते हैं। यह विशेष रूप से उपयोगी होता है यदि आप विंडोज या मैक जैसे किसी भिन्न ऑपरेटिंग सिस्टम पर फ़ाइल तक पहुंचने की योजना बनाते हैं। ऐसा करने के लिए, "-ओल" ध्वज का उपयोग करें (ध्वज में मध्य वर्ण एक लोअरकेस अक्षर "ओ" है, शून्य नहीं) इसके बाद एक स्थान और अंत-रेखा के प्रकार का प्रकार जिसे आप उपयोग करना चाहते हैं (" यूनिक्स "," डॉस ", या" मैक ")।
आप परिवर्तित टेक्स्ट पर लागू होने वाले एंड-ऑफ-लाइन वर्ण का प्रकार भी निर्दिष्ट कर सकते हैं। यह विशेष रूप से उपयोगी होता है यदि आप विंडोज या मैक जैसे किसी भिन्न ऑपरेटिंग सिस्टम पर फ़ाइल तक पहुंचने की योजना बनाते हैं। ऐसा करने के लिए, "-ओल" ध्वज का उपयोग करें (ध्वज में मध्य वर्ण एक लोअरकेस अक्षर "ओ" है, शून्य नहीं) इसके बाद एक स्थान और अंत-रेखा के प्रकार का प्रकार जिसे आप उपयोग करना चाहते हैं (" यूनिक्स "," डॉस ", या" मैक ")।
नोट: यदि आप टेक्स्ट फ़ाइल के लिए फ़ाइल नाम निर्दिष्ट नहीं करते हैं, तो pdftotext स्वचालित रूप से पीडीएफ फ़ाइल नाम के आधार का उपयोग करता है और ".txt" एक्सटेंशन जोड़ता है। उदाहरण के लिए, "file.pdf" को "file.txt" में परिवर्तित कर दिया जाएगा। यदि पाठ फ़ाइल को "-" के रूप में निर्दिष्ट किया गया है, तो परिवर्तित पाठ stdout पर भेजा जाता है, जिसका अर्थ है कि पाठ टर्मिनल विंडो में प्रदर्शित होता है और फ़ाइल में सहेजा नहीं जाता है।
नोट: यदि आप टेक्स्ट फ़ाइल के लिए फ़ाइल नाम निर्दिष्ट नहीं करते हैं, तो pdftotext स्वचालित रूप से पीडीएफ फ़ाइल नाम के आधार का उपयोग करता है और ".txt" एक्सटेंशन जोड़ता है। उदाहरण के लिए, "file.pdf" को "file.txt" में परिवर्तित कर दिया जाएगा। यदि पाठ फ़ाइल को "-" के रूप में निर्दिष्ट किया गया है, तो परिवर्तित पाठ stdout पर भेजा जाता है, जिसका अर्थ है कि पाठ टर्मिनल विंडो में प्रदर्शित होता है और फ़ाइल में सहेजा नहीं जाता है।

टर्मिनल विंडो को बंद करने के लिए, ऊपरी-बाएं कोने में "एक्स" बटन पर क्लिक करें।

Pdftotext कमांड के बारे में अधिक जानकारी के लिए, टर्मिनल विंडो में प्रॉम्प्ट पर "मैन पेज pdftotext" टाइप करें।

सिफारिश की: