Não consigo usar fetch_california_housing() para baixar o conjunto de dados de amostra. Parece que o certificado pode ter expirado?

Etapas/código para reproduzir

print('A versão do scikit-learn é {}.'.format(sklearn.__version__))
de sklearn.datasets importar fetch_california_housing
habitação = fetch_california_housing()

Resultados reais

Downloading Cal. housing from to /Users/test/scikit_learn_data
The scikit-learn version is 0.19.1.
SSLError                                  Traceback (most recent call last)
/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in do_open(self, http_class, req, **http_conn_args)
   1317                 h.request(req.get_method(), req.selector,, headers,
-> 1318                           encode_chunked=req.has_header('Transfer-encoding'))
   1319             except OSError as err: # timeout error

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/http/ in request(self, method, url, body, headers, encode_chunked)
   1238         """Send a complete request to the server."""
-> 1239         self._send_request(method, url, body, headers, encode_chunked)

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/http/ in _send_request(self, method, url, body, headers, encode_chunked)
   1284             body = _encode(body, 'body')
-> 1285         self.endheaders(body, encode_chunked=encode_chunked)

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/http/ in endheaders(self, message_body, encode_chunked)
   1233             raise CannotSendHeader()
-> 1234         self._send_output(message_body, encode_chunked=encode_chunked)

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/http/ in _send_output(self, message_body, encode_chunked)
   1025         del self._buffer[:]
-> 1026         self.send(msg)

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/http/ in send(self, data)
    963             if self.auto_open:
--> 964                 self.connect()
    965             else:

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/http/ in connect(self)
   1399             self.sock = self._context.wrap_socket(self.sock,
-> 1400                                                   server_hostname=server_hostname)
   1401             if not self._context.check_hostname and self._check_hostname:

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/ in wrap_socket(self, sock, server_side, do_handshake_on_connect, suppress_ragged_eofs, server_hostname, session)
    400                          server_hostname=server_hostname,
--> 401                          _context=self, _session=session)

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/ in __init__(self, sock, keyfile, certfile, server_side, cert_reqs, ssl_version, ca_certs, do_handshake_on_connect, family, type, proto, fileno, suppress_ragged_eofs, npn_protocols, ciphers, server_hostname, _context, _session)
    807                         raise ValueError("do_handshake_on_connect should not be specified for non-blocking sockets")
--> 808                     self.do_handshake()

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/ in do_handshake(self, block)
   1060                 self.settimeout(None)
-> 1061             self._sslobj.do_handshake()
   1062         finally:

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/ in do_handshake(self)
    682         """Start the SSL/TLS handshake."""
--> 683         self._sslobj.do_handshake()
    684         if self.context.check_hostname:

SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:749)

During handling of the above exception, another exception occurred:

URLError                                  Traceback (most recent call last)
<ipython-input-18-dc07bc139b51> in <module>()
      1 print('The scikit-learn version is {}.'.format(sklearn.__version__))
      2 from sklearn.datasets import fetch_california_housing
----> 3 housing = fetch_california_housing()

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/datasets/ in fetch_california_housing(data_home, download_if_missing)
     99             ARCHIVE.url, data_home))
--> 101         archive_path = _fetch_remote(ARCHIVE, dirname=data_home)
    103         with"r:gz", name=archive_path) as f:

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/datasets/ in _fetch_remote(remote, dirname)
    872     file_path = (remote.filename if dirname is None
    873                  else join(dirname, remote.filename))
--> 874     urlretrieve(remote.url, file_path)
    875     checksum = _sha256(file_path)
    876     if remote.checksum != checksum:

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in urlretrieve(url, filename, reporthook, data)
    246     url_type, path = splittype(url)
--> 248     with contextlib.closing(urlopen(url, data)) as fp:
    249         headers =

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in urlopen(url, data, timeout, cafile, capath, cadefault, context)
    221     else:
    222         opener = _opener
--> 223     return, data, timeout)
    225 def install_opener(opener):

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in open(self, fullurl, data, timeout)
    524             req = meth(req)
--> 526         response = self._open(req, data)
    528         # post-process response

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in _open(self, req, data)
    542         protocol = req.type
    543         result = self._call_chain(self.handle_open, protocol, protocol +
--> 544                                   '_open', req)
    545         if result:
    546             return result

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in _call_chain(self, chain, kind, meth_name, *args)
    502         for handler in handlers:
    503             func = getattr(handler, meth_name)
--> 504             result = func(*args)
    505             if result is not None:
    506                 return result

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in https_open(self, req)
   1359         def https_open(self, req):
   1360             return self.do_open(http.client.HTTPSConnection, req,
-> 1361                 context=self._context, check_hostname=self._check_hostname)
   1363         https_request = AbstractHTTPHandler.do_request_

/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/ in do_open(self, http_class, req, **http_conn_args)
   1318                           encode_chunked=req.has_header('Transfer-encoding'))
   1319             except OSError as err: # timeout error
-> 1320                 raise URLError(err)
   1321             r = h.getresponse()
   1322         except:

URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:749)>

Bem, espero que seja muito temporário... Ainda é um problema?

Oi Jnothman

Eu notei esse problema pela primeira vez na sexta-feira. Ainda estou recebendo o mesmo erro

Erro de URL:



Eu não estou tendo esse problema. Tem certeza de que não tem seu relógio definido
incorretamente ou algo assim?

Oi Jnothman

Estou usando um mac book pro. Parece que a hora exibida no meu computador pode estar correta. Acabei de executar o código novamente e estou recebendo o mesmo erro

Alguma ideia de como verifico se o meu relógio está acertado?


Eu esqueci de mencionar. Eu não olhei para o código, mas aposto que se você já baixou o conjunto de dados para o seu disco local, ele nunca obtém, então talvez seja por isso que está funcionando para você

Estranho, eu certamente não posso reproduzir, e me certifiquei de excluir os dados de cal_housing de ~/scikit_learn_data para que isso não pareça ser um problema no scikit-learn. Vou fechar este, @AEDWIP , por favor, forneça mais informações caso você consiga resolver seu problema.

Eu tenho um problema semelhante - Mac Book Pro, High Sierra.

Não sou especialista nessas coisas de certificado SSL, mas não acho que isso esteja relacionado ao scikit-learn como mencionei acima.

Você recebe o mesmo erro com este snippet?

from six.moves.urllib.request import urlretrieve


Eu encontrei o problema. python 3.6 no mac requer uma etapa de pós-instalação

$ less /Applications/Python\ 3.6/ReadMe.rtf

"Ao contrário de versões anteriores, as bibliotecas OpenSSL fornecidas pela Apple obsoletas não são mais usadas. Isso também significa que os certificados de confiança no sistema e chaveiros de usuário gerenciados pelo aplicativo Keychain Access e o utilitário de linha de comando de segurança não são mais usados ​​como padrões"

A solução é

$ sudo /Applications/Python\ 3.6/Install\ Certificates.command

Eu tenho o mesmo problema com o python 3.6 no Ubuntu 16.04

Solução encontrada aqui:

import os, ssl
if (not os.environ.get('PYTHONHTTPSVERIFY', '') and
    getattr(ssl, '_create_unverified_context', None)): 
    ssl._create_default_https_context = ssl._create_unverified_context

Obrigado, o código do nfrik funcionou

