如何解决如何找到numpy数组中数字之间的最小差异
我有一个带有样本的 numpy 数组,这些样本是实验的输出。样本都是整数,但我认为这并不重要。有些值在数组中出现了几次,而有些则出现了数百次 - 数组可以包含 10,000 个样本。
虽然这些值看起来是随机的,但它们具有最小间距。我的意思是,没有两个值比 27 更接近。因此,您可能会在数组中某处看到 999,027 的 50 个样本,您可能会看到 999,054 的 120 个样本,但您不会看到单个 999,036 的样本数组中任意位置的值。我需要检查数组并确定最小间距是多少,但如果可能的话要非常快。您可以将其称为“最近样本值距离”。我不必检查每个案例,因为您可能会想象只检查几个样本,只要它们的价值相近,就可以很好地猜测最小差异是多少。
有没有人有一个聪明的算法(使用 Python)可以相当快地找到任何样本之间的这个最近的最小距离?正如我所说,数组可能很大,并且每秒要检查数十个数组。
很抱歉这是一个如此奇怪的问题。我希望我已经设法解释得足够好。
解决方法
因为你有 numpy 数组,numpy 应该加快速度,虽然可能有更有效的实现:
import org.openqa.selenium.remote.DesiredCapabilities;
import org.openqa.selenium.*;
import org.openqa.selenium.firefox.*;
class firefoxT {
public static void main(String[] args) {
System.setProperty("webdriver.gecko.driver","D:\\C USERS DATA\\geckodriver.exe" );
DesiredCapabilities capabilities = DesiredCapabilities.firefox();
capabilities.setCapability("marionette",true);
WebDriver driver= new FirefoxDriver(capabilities);
driver.navigate().to("url");
driver.manage().window().maximize();
JavascriptExecutor js = (JavascriptExecutor)driver;
js.executeScript("window.scrollBy(0,600)");
try{
Thread.sleep(1000);
}catch (Exception e) {
System.out.println(e);
}
js.executeScript("document.querySelector(\"#subtab-equity > div > div.more_info_container > nav > div > div > a:nth-child(5)\").click()");
try{
Thread.sleep(1000);
}catch (Exception e) {
System.out.println(e);
}
js.executeScript("document.querySelector(\"#historical-trade > section > div > div.block-detail-dates-box > div > div.col-md-5 > ul > li:nth-child(6) > a\").click()");
try{
Thread.sleep(1000);
}catch (Exception e) {
System.out.println(e);
}
js.executeScript("document.querySelector(\"#historical-trade > section > div > div.histo-data-block > div > div:nth-child(2) > div > div:nth-child(1) > div > div.custom_select_bs.greybrdr > div > button > span\").innerText=\"EQ\"");
js.executeScript("document.querySelector(\"#historical-trade > section > div > div.histo-data-block > div > div:nth-child(2) > div > div.col-md-6.col-6.text-right > div > a\").click()");
driver.quit();
}
}
,
您可以对数组的唯一元素进行排序,然后找到连续数字之间的最短距离:
def find_min_distance(lst):
sorted_lst = sorted(set(lst))
return min(n2 - n1 for n1,n2 in zip(sorted_lst,sorted_lst[1:]))
例如:
>>> lst = [6,8,1,4,9,8]
>>> find_min_distance(lst)
1
这种方法的复杂度是 O(nlogn),其中 n 是原始数组中的元素数。除非您事先知道您的数字下降的范围,否则您不可能有更好的复杂性。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。