Отримати назву файлу за URL-адресою


146

У Java, який має форму a java.net.URLчи a , який найпростіший спосіб отримати ім’я файлу за вирахуванням розширення? Отже, у цьому прикладі я шукаю щось, що повертається .Stringhttp://www.example.com/some/path/to/a/file.xml"file"

Я можу придумати кілька способів зробити це, але я шукаю те, що легко читати і коротко.


3
Ви усвідомлюєте, що не існує жодної вимоги до того, що в кінці має бути ім’я файлу, або навіть те, що схоже на ім’я файлу. У цьому випадку на сервері може бути або не бути файл.xml.
Жалюгідна змінна

2
у цьому випадку результатом буде порожній рядок, а може бути і нульовий.
Сіет

1
Я думаю, що потрібно чіткіше визначити проблему. Що щодо наступних закінчень URL-адрес? .... / abc, .... / abc /, .... / abc.def, .... / abc.def.ghi, .... / abc? def.ghi
змінна

2
Я думаю, що це досить зрозуміло. Якщо URL-адреса вказує на файл, мене цікавить ім'я файлу за вирахуванням розширення (якщо воно має). Части запиту не входять до назви файлу.
Сіет

4
ім'я файлу - це частина URL-адреси після останньої косої риски. розширення файлу - це частина імені файлу після останнього періоду.
Сіет

Відповіді:


189

Замість того, щоб винаходити колесо, як щодо використання Apache commons-io :

import org.apache.commons.io.FilenameUtils;

public class FilenameUtilTest {

    public static void main(String[] args) throws Exception {
        URL url = new URL("http://www.example.com/some/path/to/a/file.xml?foo=bar#test");

        System.out.println(FilenameUtils.getBaseName(url.getPath())); // -> file
        System.out.println(FilenameUtils.getExtension(url.getPath())); // -> xml
        System.out.println(FilenameUtils.getName(url.getPath())); // -> file.xml
    }

}

2
У версії commons-io 2.2 принаймні вам все одно потрібно вручну обробляти URL-адреси з параметрами. Наприклад, " example.com/file.xml?date=2010-10-20 "
Лука Кінане

18
Ім'я файлуUtils.getName (URL) - це більше.
ehsun7b

4
Мабуть, дивно додати залежність від загального користування, коли легкі рішення легко доступні лише за допомогою JDK (див. URL#getPathТа String#substring/ Path#getFileNameабо File#getName).
Джейсон C

5
Клас FilenameUtils розроблений для роботи з Windows та * nix шляхом, а не з URL.
nhahtdh

4
Оновлений приклад для використання URL-адреси, показує вибіркові вихідні значення та використовує параметри запитів.
Нік Грілі

192
String fileName = url.substring( url.lastIndexOf('/')+1, url.length() );

String fileNameWithoutExtn = fileName.substring(0, fileName.lastIndexOf('.'));

17
Чому потік? Це несправедливо. Мій код працює, я лише перевірив свій код після того, як побачив групу заяву.
Справжній червоний.

2
Я підтримав вас, тому що це трохи читабельніше моєї версії. Можливо, що це означає, що воно не працює, коли немає розширення чи файлу.
Сіет

1
Ви можете залишити другий параметр наsubstring()
Джон Онстотт

12
Це не працює ні для того http://example.org/file#anchor, http://example.org/file?p=foo&q=barні для цьогоhttp://example.org/file.xml#/p=foo&q=bar
Маттіас Ронге

2
Якщо ви дозволите String url = new URL(original_url).getPath()та додасте спеціальний регістр для імен файлів, які не містять, .це добре працює.
Джейсон C

32

Якщо вам не потрібно позбуватися розширення файлу, ось спосіб це зробити, не вдаючись до схильної до помилок маніпуляції String і без використання зовнішніх бібліотек. Працює з Java 1.7+:

import java.net.URI
import java.nio.file.Paths

String url = "http://example.org/file?p=foo&q=bar"
String filename = Paths.get(new URI(url).getPath()).getFileName().toString()

1
@Carcigenicate Я просто перевірив її знову і, здається, працює добре. URI.getPath()повертає а String, тому я не бачу, чому це не вийде
Золтан

1
Нвм. Тепер я розумію, що моя проблема була пов'язана з тим, як Clojure обробляє var-args під час Java-interop. Перевантаження String не працює, тому що для передачі var-args Paths / get потрібно пропустити порожній масив. Він все ще працює, якщо ви позбавитесь від дзвінка getPathі замість цього використовуєте перевантаження URI.
Carcigenicate

@Carcigenicate ти маєш на увазі Paths.get(new URI(url))? Це, здається, не працює для мене
Zoltán

getFileName вимагає андроїд api рівень 26
Мануела

26

Про це слід вирішити (я залишлю вам помилку):

int slashIndex = url.lastIndexOf('/');
int dotIndex = url.lastIndexOf('.', slashIndex);
String filenameWithoutExtension;
if (dotIndex == -1) {
  filenameWithoutExtension = url.substring(slashIndex + 1);
} else {
  filenameWithoutExtension = url.substring(slashIndex + 1, dotIndex);
}

1
Один аспект обробки помилок, який потрібно врахувати, - це те, що ви потрапите в порожній рядок, якщо випадково передасте його URL, який не має імені файлу (наприклад, http://www.example.com/або http://www.example.com/folder/)
rtpHarry

2
Код не працює. lastIndexOfне працює таким чином. Але намір зрозумілий.
Роберт

Оновлений, тому що він не буде працювати, якщо частина фрагмента містить косої риси, і тому, що в апаш-спілах та на Яві є спеціалізовані функції, які досягають цього з 1.7
Zoltán,

14
public static String getFileName(URL extUrl) {
        //URL: "http://photosaaaaa.net/photos-ak-snc1/v315/224/13/659629384/s659629384_752969_4472.jpg"
        String filename = "";
        //PATH: /photos-ak-snc1/v315/224/13/659629384/s659629384_752969_4472.jpg
        String path = extUrl.getPath();
        //Checks for both forward and/or backslash 
        //NOTE:**While backslashes are not supported in URL's 
        //most browsers will autoreplace them with forward slashes
        //So technically if you're parsing an html page you could run into 
        //a backslash , so i'm accounting for them here;
        String[] pathContents = path.split("[\\\\/]");
        if(pathContents != null){
            int pathContentsLength = pathContents.length;
            System.out.println("Path Contents Length: " + pathContentsLength);
            for (int i = 0; i < pathContents.length; i++) {
                System.out.println("Path " + i + ": " + pathContents[i]);
            }
            //lastPart: s659629384_752969_4472.jpg
            String lastPart = pathContents[pathContentsLength-1];
            String[] lastPartContents = lastPart.split("\\.");
            if(lastPartContents != null && lastPartContents.length > 1){
                int lastPartContentLength = lastPartContents.length;
                System.out.println("Last Part Length: " + lastPartContentLength);
                //filenames can contain . , so we assume everything before
                //the last . is the name, everything after the last . is the 
                //extension
                String name = "";
                for (int i = 0; i < lastPartContentLength; i++) {
                    System.out.println("Last Part " + i + ": "+ lastPartContents[i]);
                    if(i < (lastPartContents.length -1)){
                        name += lastPartContents[i] ;
                        if(i < (lastPartContentLength -2)){
                            name += ".";
                        }
                    }
                }
                String extension = lastPartContents[lastPartContentLength -1];
                filename = name + "." +extension;
                System.out.println("Name: " + name);
                System.out.println("Extension: " + extension);
                System.out.println("Filename: " + filename);
            }
        }
        return filename;
    }

13

Один вкладиш:

new File(uri.getPath).getName

Повний код (в масштабі REPL):

import java.io.File
import java.net.URI

val uri = new URI("http://example.org/file.txt?whatever")

new File(uri.getPath).getName
res18: String = file.txt

Примітка : URI#gePathвже досить розумний, щоб позбавити параметри запиту та схему протоколу. Приклади:

new URI("http://example.org/hey/file.txt?whatever").getPath
res20: String = /hey/file.txt

new URI("hdfs:///hey/file.txt").getPath
res21: String = /hey/file.txt

new URI("file:///hey/file.txt").getPath
res22: String = /hey/file.txt

1
приємне рішення!
CybeX

1
це найкращий варіант, оскільки він використовує лише стандартний JDK
Александрос

11

Отримайте ім'я файлу з розширенням , без розширення , лише розширення лише з 3 рядками:

String urlStr = "http://www.example.com/yourpath/foler/test.png";

String fileName = urlStr.substring(urlStr.lastIndexOf('/')+1, urlStr.length());
String fileNameWithoutExtension = fileName.substring(0, fileName.lastIndexOf('.'));
String fileExtension = urlStr.substring(urlStr.lastIndexOf("."));

Log.i("File Name", fileName);
Log.i("File Name Without Extension", fileNameWithoutExtension);
Log.i("File Extension", fileExtension);

Результат журналу:

File Name(13656): test.png
File Name Without Extension(13656): test
File Extension(13656): .png

Сподіваюся, це допоможе вам.


9

Я придумав це:

String url = "http://www.example.com/some/path/to/a/file.xml";
String file = url.substring(url.lastIndexOf('/')+1, url.lastIndexOf('.'));

Або на URL-адреси без файлу, а лише шлях.
Сіет

ваш код теж правильний. ми ні в якому разі не повинні перевіряти негативні умови. нагорода для вас. btw, чи звучить ім’я Дірк Куйт?
Справжній червоний.

8

Є кілька способів:

Введення / виведення файлу Java 7:

String fileName = Paths.get(strUrl).getFileName().toString();

Apache Commons:

String fileName = FilenameUtils.getName(strUrl);

Використання Джерсі:

UriBuilder buildURI = UriBuilder.fromUri(strUrl);
URI uri = buildURI.build();
String fileName = Paths.get(uri.getPath()).getFileName();

Підрядка:

String fileName = strUrl.substring(strUrl.lastIndexOf('/') + 1);

На жаль, рішення для вводу / виводу файлів Java 7 не працює для мене. Я отримав виняток. Мені це вдається: Paths.get(new URL(strUrl).getFile()).getFileName().toString(); дякую за ідею!
Сергій Немчинов

7

Не ускладнювати :

/**
 * This function will take an URL as input and return the file name.
 * <p>Examples :</p>
 * <ul>
 * <li>http://example.com/a/b/c/test.txt -> test.txt</li>
 * <li>http://example.com/ -> an empty string </li>
 * <li>http://example.com/test.txt?param=value -> test.txt</li>
 * <li>http://example.com/test.txt#anchor -> test.txt</li>
 * </ul>
 * 
 * @param url The input URL
 * @return The URL file name
 */
public static String getFileNameFromUrl(URL url) {

    String urlString = url.getFile();

    return urlString.substring(urlString.lastIndexOf('/') + 1).split("\\?")[0].split("#")[0];
}

1
@AlexNauda Замініть url.getFile()на, url.toString()і це працює #в шляху.
Сормурас


5

Ось найпростіший спосіб зробити це в Android. Я знаю, що це не буде працювати на Java, але це може допомогти розробнику додатків Android.

import android.webkit.URLUtil;

public String getFileNameFromURL(String url) {
    String fileNameWithExtension = null;
    String fileNameWithoutExtension = null;
    if (URLUtil.isValidUrl(url)) {
        fileNameWithExtension = URLUtil.guessFileName(url, null, null);
        if (fileNameWithExtension != null && !fileNameWithExtension.isEmpty()) {
            String[] f = fileNameWithExtension.split(".");
            if (f != null & f.length > 1) {
                fileNameWithoutExtension = f[0];
            }
        }
    }
    return fileNameWithoutExtension;
}

3

Створіть об’єкт URL з рядка. Коли ви спочатку маєте об’єкт URL, існують методи, щоб легко витягнути майже будь-який фрагмент потрібної вам інформації.

Я настійно рекомендую веб-сайт Javaalmanac, який містить безліч прикладів, але з тих пір перемістився. Можливо, вам буде цікаво http://exampledepot.8waytrips.com/egs/java.io/File2Uri.html :

// Create a file object
File file = new File("filename");

// Convert the file object to a URL
URL url = null;
try {
    // The file need not exist. It is made into an absolute path
    // by prefixing the current working directory
    url = file.toURL();          // file:/d:/almanac1.4/java.io/filename
} catch (MalformedURLException e) {
}

// Convert the URL to a file object
file = new File(url.getFile());  // d:/almanac1.4/java.io/filename

// Read the file contents using the URL
try {
    // Open an input stream
    InputStream is = url.openStream();

    // Read from is

    is.close();
} catch (IOException e) {
    // Could not open the file
}

2

Якщо ви хочете отримати лише ім'я файлу з java.net.URL (не враховуючи жодних параметрів запиту), ви можете використовувати таку функцію:

public static String getFilenameFromURL(URL url) {
    return new File(url.getPath().toString()).getName();
}

Наприклад, ця вхідна URL-адреса:

"http://example.com/image.png?version=2&amp;modificationDate=1449846324000"

Було б переведено на цей вихідний рядок:

image.png

2

Я виявив, що деякі URL-адреси при передачі безпосередньо до FilenameUtils.getName повертають небажані результати, і це потрібно обробляти, щоб уникнути подвигів.

Наприклад,

System.out.println(FilenameUtils.getName("http://www.google.com/.."));

повертає

..

що я сумніваюся, хто хоче дозволити.

Наступна функція, здається, працює добре і показує деякі з цих тестових випадків, і вона повертається, nullколи ім'я файлу неможливо визначити.

public static String getFilenameFromUrl(String url)
{
    if (url == null)
        return null;
    
    try
    {
        // Add a protocol if none found
        if (! url.contains("//"))
            url = "http://" + url;

        URL uri = new URL(url);
        String result = FilenameUtils.getName(uri.getPath());

        if (result == null || result.isEmpty())
            return null;

        if (result.contains(".."))
            return null;

        return result;
    }
    catch (MalformedURLException e)
    {
        return null;
    }
}

У цьому прикладі наведено кілька простих тестових випадків:

import java.util.Objects;
import java.net.URL;
import org.apache.commons.io.FilenameUtils;

class Main {

  public static void main(String[] args) {
    validateFilename(null, null);
    validateFilename("", null);
    validateFilename("www.google.com/../me/you?trex=5#sdf", "you");
    validateFilename("www.google.com/../me/you?trex=5 is the num#sdf", "you");
    validateFilename("http://www.google.com/test.png?test", "test.png");
    validateFilename("http://www.google.com", null);
    validateFilename("http://www.google.com#test", null);
    validateFilename("http://www.google.com////", null);
    validateFilename("www.google.com/..", null);
    validateFilename("http://www.google.com/..", null);
    validateFilename("http://www.google.com/test", "test");
    validateFilename("https://www.google.com/../../test.png", "test.png");
    validateFilename("file://www.google.com/test.png", "test.png");
    validateFilename("file://www.google.com/../me/you?trex=5", "you");
    validateFilename("file://www.google.com/../me/you?trex", "you");
  }

  private static void validateFilename(String url, String expectedFilename){
    String actualFilename = getFilenameFromUrl(url);

    System.out.println("");
    System.out.println("url:" + url);
    System.out.println("filename:" + expectedFilename);

    if (! Objects.equals(actualFilename, expectedFilename))
      throw new RuntimeException("Problem, actual=" + actualFilename + " and expected=" + expectedFilename + " are not equal");
  }

  public static String getFilenameFromUrl(String url)
  {
    if (url == null)
      return null;

    try
    {
      // Add a protocol if none found
      if (! url.contains("//"))
        url = "http://" + url;

      URL uri = new URL(url);
      String result = FilenameUtils.getName(uri.getPath());

      if (result == null || result.isEmpty())
        return null;

      if (result.contains(".."))
        return null;

      return result;
    }
    catch (MalformedURLException e)
    {
      return null;
    }
  }
}

1

URL-адреси можуть мати параметри, зрештою, це

 /**
 * Getting file name from url without extension
 * @param url string
 * @return file name
 */
public static String getFileName(String url) {
    String fileName;
    int slashIndex = url.lastIndexOf("/");
    int qIndex = url.lastIndexOf("?");
    if (qIndex > slashIndex) {//if has parameters
        fileName = url.substring(slashIndex + 1, qIndex);
    } else {
        fileName = url.substring(slashIndex + 1);
    }
    if (fileName.contains(".")) {
        fileName = fileName.substring(0, fileName.lastIndexOf("."));
    }

    return fileName;
}

/може з’явитися фрагмент. Ви витягнете неправильні речі.
nhahtdh

1

UrlОб'єкт URLLIB дозволяє отримати доступ неекранованого імені файлу на шляху в. Ось кілька прикладів:

String raw = "http://www.example.com/some/path/to/a/file.xml";
assertEquals("file.xml", Url.parse(raw).path().filename());

raw = "http://www.example.com/files/r%C3%A9sum%C3%A9.pdf";
assertEquals("résumé.pdf", Url.parse(raw).path().filename());

0

Відповідь Енді повторно використовується split ():

Url u= ...;
String[] pathparts= u.getPath().split("\\/");
String filename= pathparts[pathparts.length-1].split("\\.", 1)[0];

0
public String getFileNameWithoutExtension(URL url) {
    String path = url.getPath();

    if (StringUtils.isBlank(path)) {
        return null;
    }
    if (StringUtils.endsWith(path, "/")) {
        //is a directory ..
        return null;
    }

    File file = new File(url.getPath());
    String fileNameWithExt = file.getName();

    int sepPosition = fileNameWithExt.lastIndexOf(".");
    String fileNameWithOutExt = null;
    if (sepPosition >= 0) {
        fileNameWithOutExt = fileNameWithExt.substring(0,sepPosition);
    }else{
        fileNameWithOutExt = fileNameWithExt;
    }

    return fileNameWithOutExt;
}

0

Як щодо цього:

String filenameWithoutExtension = null;
String fullname = new File(
    new URI("http://www.xyz.com/some/deep/path/to/abc.png").getPath()).getName();

int lastIndexOfDot = fullname.lastIndexOf('.');
filenameWithoutExtension = fullname.substring(0, 
    lastIndexOfDot == -1 ? fullname.length() : lastIndexOfDot);

0

Щоб повернути ім'я файлу без розширення та без параметрів, використовуйте наступне:

String filenameWithParams = FilenameUtils.getBaseName(urlStr); // may hold params if http://example.com/a?param=yes
return filenameWithParams.split("\\?")[0]; // removing parameters from url if they exist

Щоб повернути ім'я файлу з розширенням без парами, скористайтеся цим:

/** Parses a URL and extracts the filename from it or returns an empty string (if filename is non existent in the url) <br/>
 * This method will work in win/unix formats, will work with mixed case of slashes (forward and backward) <br/>
 * This method will remove parameters after the extension
 *
 * @param urlStr original url string from which we will extract the filename
 * @return filename from the url if it exists, or an empty string in all other cases */
private String getFileNameFromUrl(String urlStr) {
    String baseName = FilenameUtils.getBaseName(urlStr);
    String extension = FilenameUtils.getExtension(urlStr);

    try {
        extension = extension.split("\\?")[0]; // removing parameters from url if they exist
        return baseName.isEmpty() ? "" : baseName + "." + extension;
    } catch (NullPointerException npe) {
        return "";
    }
}

0

Крім усіх прогресивних методів, мій простий трюк StringTokenizer:

import java.util.ArrayList;
import java.util.StringTokenizer;

public class URLName {
    public static void main(String args[]){
        String url = "http://www.example.com/some/path/to/a/file.xml";
        StringTokenizer tokens = new StringTokenizer(url, "/");

        ArrayList<String> parts = new ArrayList<>();

        while(tokens.hasMoreTokens()){
            parts.add(tokens.nextToken());
        }
        String file = parts.get(parts.size() -1);
        int dot = file.indexOf(".");
        String fileName = file.substring(0, dot);
        System.out.println(fileName);
    }
}

0

Якщо ви використовуєте Spring , є помічник для обробки URI. Ось рішення:

List<String> pathSegments = UriComponentsBuilder.fromUriString(url).build().getPathSegments();
String filename = pathSegments.get(pathSegments.size()-1);


-1
create a new file with string image path

    String imagePath;
    File test = new File(imagePath);
    test.getName();
    test.getPath();
    getExtension(test.getName());


    public static String getExtension(String uri) {
            if (uri == null) {
                return null;
            }

            int dot = uri.lastIndexOf(".");
            if (dot >= 0) {
                return uri.substring(dot);
            } else {
                // No extension.
                return "";
            }
        }

-1

У мене така ж проблема, з вашою. Я вирішив це таким чином:

var URL = window.location.pathname; // Gets page name
var page = URL.substring(URL.lastIndexOf('/') + 1); 
console.info(page)

Java не JavaScript
nathanfranke

-3

імпорт java.io. *;

import java.net.*;

public class ConvertURLToFileName{


   public static void main(String[] args)throws IOException{
   BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
   System.out.print("Please enter the URL : ");

   String str = in.readLine();


   try{

     URL url = new URL(str);

     System.out.println("File : "+ url.getFile());
     System.out.println("Converting process Successfully");

   }  
   catch (MalformedURLException me){

      System.out.println("Converting process error");

 }

Я сподіваюся, що це вам допоможе.


2
getFile () не робить те, що ви думаєте. На думку doc, це насправді getPath () + getQuery, що досить безглуздо. java.sun.com/j2se/1.4.2/docs/api/java/net/URL.html#getFile ()
bobince
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.