Як розібрати URL-адресу на ім'я хоста та шлях у javascript?


379

Я хотів би взяти рядок

var a = "http://example.com/aa/bb/"

і обробити його в такий об'єкт, що

a.hostname == "example.com"

і

a.pathname == "/aa/bb"

11
Якщо ви працюєте над поточною URL-адресою, ви можете отримати доступ hostnameта pathnameбезпосередньо з locationоб’єкта.
rvighne

1
що з "lastPathPart"?
Віктор

Не повторне вираження, але модуль Python tldextract робить саме це: github.com/john-kurkowski/tldextract
Олівер Олівер

Відповіді:


395

Сучасний спосіб:

new URL("http://example.com/aa/bb/")

Повертає об'єкт із властивостями hostnameта pathnameразом з кількома іншими .

Перший аргумент - відносна або абсолютна URL-адреса; якщо він відносний, то вам потрібно вказати другий аргумент (базова URL-адреса). Наприклад, для URL-адреси відносно поточної сторінки:

new URL("/aa/bb/", location)

Окрім браузерів, цей API також доступний у Node.js починаючи з v7, через require('url').URL.


7
Приємно! Відносні URL-адреси, хоча ... :( new URL('/stuff?foo=bar#baz')->SyntaxError: Failed to construct 'URL': Invalid URL
lakenen

56
Експериментальна технологія: IE цього не підтримує! developer.mozilla.org/en-US/docs/Web/API/URL/…
cwouter

10
@cwouter: Це працює в Edge, але замінює IE
rvighne

4
так це зробити, у краю вже є 3 версії, тобто немає значення
Claudiu Creanga

7
Те, що у JavaScript немає вбудованого способу розбору URL-адрес, який працює на браузерах чи серверах, дуже сумно ...
Skitterm

365
var getLocation = function(href) {
    var l = document.createElement("a");
    l.href = href;
    return l;
};
var l = getLocation("http://example.com/path");
console.debug(l.hostname)
>> "example.com"
console.debug(l.pathname)
>> "/path"

14
Ви впевнені, що це рішення, сумісне для веб-переглядачів?
cllpse

70
Слід зазначити, що, хоча це може допомогти / відповісти на оригінальний плакат, ця відповідь буде працювати лише для людей, які виконують JS в браузері, оскільки він покладається на DOM, щоб виконувати свою роботу.
Адам Баткін

4
Ще один приклад простоти, поряд з винахідливістю.
Саїд Неаматі

26
Не працює в IE, якщо href відносний. l.name name буде порожнім. Якщо ви надаєте лише повну URL-адресу, це спрацює.
Derek Prior

7
Навіть з абсолютними URL-адресами IE (перевірена в IE 11) поводиться інакше, ніж у Chrome та Firefox. IE pathnameвидаляє провідну косу рису, а інші браузери - не. Таким чином, ви закінчите /pathабо path, залежно від вашого браузера.
TrueWill

299

знайдено тут: https://gist.github.com/jlong/2428561

var parser = document.createElement('a');
parser.href = "http://example.com:3000/pathname/?search=test#hash";

parser.protocol; // => "http:"
parser.host;     // => "example.com:3000"
parser.hostname; // => "example.com"
parser.port;     // => "3000"
parser.pathname; // => "/pathname/"
parser.hash;     // => "#hash"
parser.search;   // => "?search=test"
parser.origin;   // => "http://example.com:3000"

11
Зауважте, що якщо ви просто хочете отримати проаналізовані частини поточного розташування браузера, перші два рядки стають, parser = location;і всі наступні рядки працюють. Спробував це зараз у Chrome та IE9.
Лі Меадор

9
Також зауважте, що pathnameвін не включає провідну косу рису в IE. Піди розберися. : D
nevelis

3
Для IE використовуйте "/" + parser.pathname
sbose

Попередження: воно повернеться, http:навіть якщо ви перейдете просто domain.comдо href (без жодного протоколу). Я хотів використати це для перевірки відсутності протоколу, і якщо так, я можу його додати, але він передбачає http: тому не вдалося його використовувати для цієї мети.
Макс Ходжес

Ім'я хоста фактично включає протокол. Перевірте останню версію Chrome.
AndroidDev

109

Ось проста функція за допомогою регулярного вираження, що імітує a поведінку тегів.

Плюси

  • передбачувана поведінка (немає проблем із веб-переглядачем)
  • не потрібен DOM
  • це дійсно коротко.

Мінуси

  • Регепс трохи важко читати

-

function getLocation(href) {
    var match = href.match(/^(https?\:)\/\/(([^:\/?#]*)(?:\:([0-9]+))?)([\/]{0,1}[^?#]*)(\?[^#]*|)(#.*|)$/);
    return match && {
        href: href,
        protocol: match[1],
        host: match[2],
        hostname: match[3],
        port: match[4],
        pathname: match[5],
        search: match[6],
        hash: match[7]
    }
}

-

getLocation("http://example.com/");
/*
{
    "protocol": "http:",
    "host": "example.com",
    "hostname": "example.com",
    "port": undefined,
    "pathname": "/"
    "search": "",
    "hash": "",
}
*/

getLocation("http://example.com:3000/pathname/?search=test#hash");
/*
{
    "protocol": "http:",
    "host": "example.com:3000",
    "hostname": "example.com",
    "port": "3000",
    "pathname": "/pathname/",
    "search": "?search=test",
    "hash": "#hash"
}
*/

Редагувати:

Ось розбивка регулярного виразу

var reURLInformation = new RegExp([
    '^(https?:)//', // protocol
    '(([^:/?#]*)(?::([0-9]+))?)', // host (hostname and port)
    '(/{0,1}[^?#]*)', // pathname
    '(\\?[^#]*|)', // search
    '(#.*|)$' // hash
].join(''));
var match = href.match(reURLInformation);

4
Не працює з жодними відносними URL-адресами. Чи дотримувались ви RFC-3986 під час виготовлення регулярного виразу? > getLocation ("// example.com/"); null> getLocation ("/ ім'я шляху /? пошук"); null> getLocation ("/ ім'я шляху /"); null> getLocation ("відносний"); null
gregers

2
Мені подобається, як це не використовує DOM, але грегери мають хороший момент. Було б непогано, якби це обробляло відносні шляхи. Для заповнення пробілів та додавання коду знадобиться використовувати window.location (елемент). У такому випадку метод став би лицемірним. Якщо немає альтернативи, не впевнений, як це можна вирішити ідеально.
Турбо

Доданий ключ href з оригінальним URL-адресою, це забезпечує узгодженість цього повернутого об'єкта з реалізацією dom.
mattdlockyer

2
Якщо комусь потрібно проаналізувати відносні URL-адреси, тут буде оновлений регулярний вираз: / ^ (? :( https? \:) \ / \ /)? (([^: \ /? #] *) (?: \: ([0 -9] +))?) ([\ /] {0,1} [^? #] *) (\? [^ #] * |) (#. * |) $ /
шленський

75
var loc = window.location;  // => "http://example.com:3000/pathname/?search=test#hash"

повертає поточнийUrl.

Якщо ви хочете передавати власну рядок у вигляді URL-адреси ( не працює в IE11 ):

var loc = new URL("http://example.com:3000/pathname/?search=test#hash")

Тоді ви можете розібрати його так:

loc.protocol; // => "http:"
loc.host;     // => "example.com:3000"
loc.hostname; // => "example.com"
loc.port;     // => "3000"
loc.pathname; // => "/pathname/"
loc.hash;     // => "#hash"
loc.search;   // => "?search=test"

60

Відповідь freddiefujiwara досить хороша, але мені також потрібно було підтримувати відносні URL-адреси в Internet Explorer. Я придумав таке рішення:

function getLocation(href) {
    var location = document.createElement("a");
    location.href = href;
    // IE doesn't populate all link properties when setting .href with a relative URL,
    // however .href will return an absolute URL which then can be used on itself
    // to populate these additional fields.
    if (location.host == "") {
      location.href = location.href;
    }
    return location;
};

Тепер використовуйте його, щоб отримати необхідні властивості:

var a = getLocation('http://example.com/aa/bb/');
document.write(a.hostname);
document.write(a.pathname);

Приклад JSFiddle: http://jsfiddle.net/6AEAB/


4
Це має бути прийнятою відповіддю. Дуже розумне використання відносної та абсолютної обробки URL-адрес. +1
L0j1k

Мабуть , не перший раз , коли посилання JSFiddle помер stackoverflow.com/questions/25179964 / ...
Клаус

3
Це спрацювало чудово, проте у мене було одне оновлення, яке, сподіваюся, допоможе іншим. Я використовую це для перевірки походження запиту після повідомлення, і коли порт є портом за замовчуванням (80 або 443), він не додається до шляху. Я це умовно перевірив, створюючи свою URL-адресу: var locationHost = (location.port !== '80' && location.port !== '443') ? location.host : location.hostname; var locationOrigin = location.protocol + '//' + locationHost;
rhoster

2
Я зробив цей коментар в іншому місці щодо більш популярного варіанту цього рішення, але оскільки це було моє улюблене рішення, я хотів його повторити тут. У IE11 наявність імені користувача у href призведе до того, що всі ці властивості читання видають помилки безпеки. Приклад: " example.com " буде добре працювати. Але " username@www.example.com " або " username: password@www.example.com " зробить будь-яку спробу посилання на одне з інших властивостей елемента якоря (наприклад: хеш), щоб вийти з ладу, і видасть неприємну помилку.
Кліппі

17

js-uri (доступний у коді Google) бере рядкову URL-адресу та вирішує з неї об’єкт URI:

var some_uri = new URI("http://www.example.com/foo/bar");

alert(some_uri.authority); // www.example.com
alert(some_uri);           // http://www.example.com/foo/bar

var blah      = new URI("blah");
var blah_full = blah.resolve(some_uri);
alert(blah_full);         // http://www.example.com/foo/blah

Дякую!!! але я хочу uri = new Location (" example.com/aa/bb" ) typeof (window.location) == typeof (uri)
freddiefujiwara

Оскільки window.location є рядком, я насправді не бачу, як це було б можливо чи корисно. Чому типи повинні відповідати, коли ви можете легко перетворити з одного на інший?
Рекс М

developer.mozilla.org/uk/DOM/window.location дуже приємна api !! тож сподіваюсь перетворити рядок у об’єкт window.location
freddiefujiwara

1
Встановлення window.location змінює браузер, так що цього не відбудеться.
epascarello

1
Хм, це правильно. window.location не є рядком, але може бути призначений з рядка. Я не впевнений, чи можна це наслідувати, я намагався призначити прототип місця розташування новому об’єкту Uri, але це не вийшло.
Rex M

12

Що про просте регулярне вираження?

url = "http://www.example.com/path/to/somwhere";
urlParts = /^(?:\w+\:\/\/)?([^\/]+)(.*)$/.exec(url);
hostname = urlParts[1]; // www.example.com
path = urlParts[2]; // /path/to/somwhere

Спробуйте проаналізувати щось дійсне на кшталт, //user:password@example.com/path/x?y=zі ви побачите, чому простий регулярний вираз це не скоротить. Тепер киньте щось недійсне для цього, і воно також повинно випадати передбачувано.
Мікко Ранталайнен

Простий регулярний вираз призначений для простих проблем :) Але мені не здається, що URL-адреса, яка є такою, не піддається регулюванню, просто знадобиться ще декілька налаштувань. Але я, мабуть, пішов би до якоїсь бібліотеки, якщо мені потрібно щось складніше та пультоване.
svestka

12

сьогодні я зустрічаюся з цією проблемою і знайшов: URL - MDN Web API

var url = new URL("http://test.example.com/dir/subdir/file.html#hash");

Це повернення:

{ hash:"#hash", host:"test.example.com", hostname:"test.example.com", href:"http://test.example.com/dir/subdir/file.html#hash", origin:"http://test.example.com", password:"", pathname:"/dir/subdir/file.html", port:"", protocol:"http:", search: "", username: "" }

Сподіваюся, що мій перший внесок вам допомагає!


Дублююча відповідь
Мартін ван Дріел

6
Так, але хлопець у верхній частині просто оновив свою школу в 2017 році, я розміщую це в 2016 році.
А. Мойн

Ах моє погано, вибачте
Мартін ван Дріел

9

Ось версія, яку я скопіював із https://gist.github.com/1847816 , але переписав, щоб було легше читати та налагоджувати. Мета копіювання даних якоря до іншої змінної, що називається "результат", полягає в тому, що дані якоря досить довгі, тому копіювання обмеженої кількості значень у результат допоможе спростити результат.

/**
 * See: https://gist.github.com/1847816
 * Parse a URI, returning an object similar to Location
 * Usage: var uri = parseUri("hello?search#hash")
 */
function parseUri(url) {

  var result = {};

  var anchor = document.createElement('a');
  anchor.href = url;

  var keys = 'protocol hostname host pathname port search hash href'.split(' ');
  for (var keyIndex in keys) {
    var currentKey = keys[keyIndex]; 
    result[currentKey] = anchor[currentKey];
  }

  result.toString = function() { return anchor.href; };
  result.requestUri = result.pathname + result.search;  
  return result;

}

6

Крос-браузер URL синтаксичний , працює по відносному шляху проблеми для IE 6, 7, 8 і 9:

function ParsedUrl(url) {
    var parser = document.createElement("a");
    parser.href = url;

    // IE 8 and 9 dont load the attributes "protocol" and "host" in case the source URL
    // is just a pathname, that is, "/example" and not "http://domain.com/example".
    parser.href = parser.href;

    // IE 7 and 6 wont load "protocol" and "host" even with the above workaround,
    // so we take the protocol/host from window.location and place them manually
    if (parser.host === "") {
        var newProtocolAndHost = window.location.protocol + "//" + window.location.host;
        if (url.charAt(1) === "/") {
            parser.href = newProtocolAndHost + url;
        } else {
            // the regex gets everything up to the last "/"
            // /path/takesEverythingUpToAndIncludingTheLastForwardSlash/thisIsIgnored
            // "/" is inserted before because IE takes it of from pathname
            var currentFolder = ("/"+parser.pathname).match(/.*\//)[0];
            parser.href = newProtocolAndHost + currentFolder + url;
        }
    }

    // copies all the properties to this object
    var properties = ['host', 'hostname', 'hash', 'href', 'port', 'protocol', 'search'];
    for (var i = 0, n = properties.length; i < n; i++) {
      this[properties[i]] = parser[properties[i]];
    }

    // pathname is special because IE takes the "/" of the starting of pathname
    this.pathname = (parser.pathname.charAt(0) !== "/" ? "/" : "") + parser.pathname;
}

Використання ( тут демонструється JSFiddle ):

var myUrl = new ParsedUrl("http://www.example.com:8080/path?query=123#fragment");

Результат:

{
    hash: "#fragment"
    host: "www.example.com:8080"
    hostname: "www.example.com"
    href: "http://www.example.com:8080/path?query=123#fragment"
    pathname: "/path"
    port: "8080"
    protocol: "http:"
    search: "?query=123"
}

5

Для тих, хто шукає сучасне рішення, яке працює в IE, Firefox та Chrome:

Жодне з цих рішень, що використовують елемент гіперпосилання, не працюватиме так само в хромі.Якщо ви передасте неправильний (або порожній) URL-адрес для chrome, він завжди поверне хост, звідки викликається сценарій. Так що в IE ви порожні, тоді як у Chrome ви отримаєте localhost (або будь-який інший).

Якщо ви намагаєтесь подивитися на рефератора, це обман. Ви хочете переконатися, що хост, який ви отримаєте назад, був у оригінальній URL-адресі, щоб вирішити це:

    function getHostNameFromUrl(url) {
        // <summary>Parses the domain/host from a given url.</summary>
        var a = document.createElement("a");
        a.href = url;

        // Handle chrome which will default to domain where script is called from if invalid
        return url.indexOf(a.hostname) != -1 ? a.hostname : '';
    }

Це дуже важлива річ, яку слід врахувати!
2rs2ts

Це повністю порушує відносні URL-адреси!
lakenen

4

Шлях AngularJS - скрипка тут: http://jsfiddle.net/PT5BG/4/

<!DOCTYPE html>
<html>
<head>
    <title>Parse URL using AngularJS</title>
</head>
<body ng-app ng-controller="AppCtrl" ng-init="init()">

<h3>Parse URL using AngularJS</h3>

url: <input type="text" ng-model="url" value="" style="width:780px;">

<ul>
    <li>href = {{parser.href}}</li>
    <li>protocol = {{parser.protocol}}</li>
    <li>host = {{parser.host}}</li>
    <li>hostname = {{parser.hostname}}</li>
    <li>port = {{parser.port}}</li>
    <li>pathname = {{parser.pathname}}</li>
    <li>hash = {{parser.hash}}</li>
    <li>search = {{parser.search}}</li>
</ul>

<script src="https://ajax.googleapis.com/ajax/libs/angularjs/1.0.6/angular.min.js"></script>

<script>
function AppCtrl($scope) {

    $scope.$watch('url', function() {
        $scope.parser.href = $scope.url;
    });

    $scope.init = function() {
        $scope.parser = document.createElement('a');
        $scope.url = window.location;
    }

}
</script>

</body>
</html>

2
Буде кутовіше, якщо ви користуватиметесь $documentі $windowпослугами
Чернів,

3

Просте і надійне рішення з використанням модульної схеми. Сюди входить виправлення IE, де у pathnameне завжди є провідна коса коса риса ( /).

Я створив Gist разом з JSFiddle, який пропонує більш динамічний аналізатор. Я рекомендую вам перевірити це та надіслати відгук.

var URLParser = (function (document) {
    var PROPS = 'protocol hostname host pathname port search hash href'.split(' ');
    var self = function (url) {
        this.aEl = document.createElement('a');
        this.parse(url);
    };
    self.prototype.parse = function (url) {
        this.aEl.href = url;
        if (this.aEl.host == "") {
           this.aEl.href = this.aEl.href;
        }
        PROPS.forEach(function (prop) {
            switch (prop) {
                case 'hash':
                    this[prop] = this.aEl[prop].substr(1);
                    break;
                default:
                    this[prop] = this.aEl[prop];
            }
        }, this);
        if (this.pathname.indexOf('/') !== 0) {
            this.pathname = '/' + this.pathname;
        }
        this.requestUri = this.pathname + this.search;
    };
    self.prototype.toObj = function () {
        var obj = {};
        PROPS.forEach(function (prop) {
            obj[prop] = this[prop];
        }, this);
        obj.requestUri = this.requestUri;
        return obj;
    };
    self.prototype.toString = function () {
        return this.href;
    };
    return self;
})(document);

Демо

Вихідні дані

{
 "protocol": "https:",
 "hostname": "www.example.org",
 "host": "www.example.org:5887",
 "pathname": "/foo/bar",
 "port": "5887",
 "search": "?a=1&b=2",
 "hash": "section-1",
 "href": "https://www.example.org:5887/foo/bar?a=1&b=2#section-1",
 "requestUri": "/foo/bar?a=1&b=2"
}
{
 "protocol": "ftp:",
 "hostname": "www.files.com",
 "host": "www.files.com:22",
 "pathname": "/folder",
 "port": "22",
 "search": "?id=7",
 "hash": "",
 "href": "ftp://www.files.com:22/folder?id=7",
 "requestUri": "/folder?id=7"
}


3

Чому його не використовувати?

        $scope.get_location=function(url_str){
        var parser = document.createElement('a');
        parser.href =url_str;//"http://example.com:3000/pathname/?search=test#hash";
        var info={
            protocol:parser.protocol,   
            hostname:parser.hostname, // => "example.com"
            port:parser.port,     // => "3000"
            pathname:parser.pathname, // => "/pathname/"
            search:parser.search,   // => "?search=test"
            hash:parser.hash,     // => "#hash"
            host:parser.host, // => "example.com:3000"      
        }
        return info;
    }
    alert( JSON.stringify( $scope.get_location("http://localhost:257/index.php/deploy/?asd=asd#asd"),null,4 ) );

3

Ви також можете використовувати parse_url()функцію проекту Locutus (колишній php.js).

Код:

parse_url('http://username:password@hostname/path?arg=value#anchor');

Результат:

{
  scheme: 'http',
  host: 'hostname',
  user: 'username',
  pass: 'password',
  path: '/path',
  query: 'arg=value',
  fragment: 'anchor'
}

1
ця URL-адреса не працювала для мене, але я знайшов її тут github.com/hirak/phpjs/blob/master/functions/url/parse_url.js
Stan Quinn

@StanQuinn, це тому, що php.js змінив своє ім'я на Локутус. Я оновив свою відповідь за новим посиланням.
Андрій Руденко

3
function parseUrl(url) {
    var m = url.match(/^(([^:\/?#]+:)?(?:\/\/((?:([^\/?#:]*):([^\/?#:]*)@)?([^\/?#:]*)(?::([^\/?#:]*))?)))?([^?#]*)(\?[^#]*)?(#.*)?$/),
        r = {
            hash: m[10] || "",                   // #asd
            host: m[3] || "",                    // localhost:257
            hostname: m[6] || "",                // localhost
            href: m[0] || "",                    // http://username:password@localhost:257/deploy/?asd=asd#asd
            origin: m[1] || "",                  // http://username:password@localhost:257
            pathname: m[8] || (m[1] ? "/" : ""), // /deploy/
            port: m[7] || "",                    // 257
            protocol: m[2] || "",                // http:
            search: m[9] || "",                  // ?asd=asd
            username: m[4] || "",                // username
            password: m[5] || ""                 // password
        };
    if (r.protocol.length == 2) {
        r.protocol = "file:///" + r.protocol.toUpperCase();
        r.origin = r.protocol + "//" + r.host;
    }
    r.href = r.origin + r.pathname + r.search + r.hash;
    return m && r;
};
parseUrl("http://username:password@localhost:257/deploy/?asd=asd#asd");

Він працює як з абсолютними, так і з відносними URL-адресами


abc://username:password@example.com:123/path/data?key=value&key2=value2#fragid1
山 茶树 和 葡萄 树

@ 山 茶树 和 葡萄 树 Я оновив код, щоб правильно обробляти підкомпонент користувача. Дякуємо за Ваш коментар, я раніше не помічав цієї проблеми
Микола

люблю цей реджекс
Kunal

2

Перестаньте винаходити колесо. Використовуйте https://github.com/medialize/URI.js/

var uri = new URI("http://example.org:80/foo/hello.html");
// get host
uri.host(); // returns string "example.org:80"
// set host
uri.host("example.org:80");

5
Тому що кожного разу, коли ви хочете вирішити проблему ... користуйтеся бібліотекою? Гаразд ... (не)
jiminikiz

4
Не завжди (насправді майже ніколи), але URL-адреси дуже складні для розбору, у RFC є багато багато деталей. Краще використовувати бібліотеку, яку тисячі використовували і перевіряли.
Гюго Секейра

Як щодо просто використовувати те, що вбудовано, замість того, щоб хтось інший винаходив колесо з бібліотекою? Дивіться stackoverflow.com/a/24006120/747739
Phil

Немає підтримки IE11 для вбудованої функції, тому ця бібліотека є чудовою. Сказати ніколи не користуватися бібліотекою - це як сказати, що ми ніколи не повинні використовувати jQuery, а просто писати нативний код, що абсолютно смішно. У кожного розробника є різні випадки використання, немає "найкращого" способу, іноді найкраще працює ваніль / рідний, іноді це не так ... чомусь 92% розробників все-таки мають навчитися.
tno2007

1

Просто використовуйте бібліотеку url.js (для Інтернету та node.js).

https://github.com/websanova/js-url

url: http://example.com?param=test#param=again

url('?param'); // test
url('#param'); // again
url('protocol'); // http
url('port'); // 80
url('domain'); // example.com
url('tld'); // com

etc...

1

простий хак з першою відповіддю

var getLocation = function(href=window.location.href) {
    var l = document.createElement("a");
    l.href = href;
    return l;
};

це може використовуватись навіть без аргументу для з'ясування поточного імені хоста getLocation (). ім'я хоста дасть поточне ім'я хоста

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.