<div dir="ltr"><div>Dear all,</div><div><br></div><div></div><div>Like most people doing research in AI/ML I'm also curious about this topic, but also wonder what kind of biases are introduced when we expect non-human things to follow human intuition.  So just to input my two cents on this and also ask the opinion of more experienced researchers:</div><div><br></div><div>Say you have a state of the art CNN that correctly identifies 99% of tumors in an image.</div><div>The most common position is that this CNN doesn't "understand" tumors in the way oncologists do.</div><div>But do oncologists understand tumors in the way the CNN does? I'm sure showing them convolutional filters and activations wouldn't help much in a diagnosis.</div><div>When the CNN correctly classifies something a human wouldn't, what do we make of that in the realm of "understanding"?</div><div>Is "understanding" just synonyms with "reasoning that follows human intuition"? Reasoning that doesn't follow human intuition is not "understanding"?</div><div><br></div><div>This question can be expanded to any other type of task beyond image classification.</div><div><br></div><div>Cheers,</div><div><br></div><div>Iam<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Jun 12, 2022 at 6:36 AM Stephen Jose Hanson <<a href="mailto:stephen.jose.hanson@rutgers.edu">stephen.jose.hanson@rutgers.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">



<div bgcolor="#ecca99">
<p><font size="+1"><font face="monospace">Bets?  The <i>Augus</i><i>t</i> discussion months ago has reduced to bets?  Really?<br>
</font></font></p>
<p><font size="+1">Gentleman, lets step back a bit... on the one hand this seems like schoolyard squabble about who can jump from the highest point on a wall without breaking a leg..</font></p>
<p><font size="+1">On the other hand.. it also feels like a troll*  standing in a North Carolina field saying to Orville..  .."OK, so it worked for 12 seconds, I bet this will never fly across an ocean!"</font></p>
<p><font size="+1">OR</font></p>
<p><font size="+1">" (1961) sure sure NASA, you got a capsule in the upper stratosphere, but  I bet you will never get to  the moon".</font></p>
<p><font size="+1">OR</font></p>
<p><font size="+1">"1994, Ok,  your computational biology model can do protein folding with about 40% match.. 20 years later not much improvement (60%).. so I bet you'll never reach 90% match".    (in 2020, Deepmind published Alphafold--which reached over 94%
 matches).<br>
</font></p>
<p><font size="+1"><br>
</font></p>
<p><font size="+1">So this type of counterfactual silliness, is simply due to our deep ignorance of the technologies in the future.. but who could know the tech of the future? 
<br>
</font></p>
<p><font size="+1">Its really really really early in what is happening in AI now. .snipping at it at this point is sort of pointless.   As we just don't know alot yet.</font></p>
<p><font size="+1">(1) how do DL models learn? (2) how do DL models represent knowledge?  (3) What do DL models have to do with Brain?</font></p>
<p><font size="+1">Instead here's a useful project:<br>
</font></p>
<p><font size="+1">Recent work in language acquisition due to Yang an Piantadosi (PNAS 2022) who developed a symbolic model--similar to what Chomsky described as a Universal learning model (starting with recursion), seems to work surprisingly well.  They provide
 a large benchmark number of learning problems (FSM, CF, CS) cases.. which would be an interesting project for someone interested in RNN-DLs or LSTMs to show the same results, without the symbolic alg, they defined.<br>
</font></p>
<p><font size="+1">Y Yang and S.T. Piantadosi One model for the learning of language January 24, 2022, PNAS.</font></p>
<p><font size="+1">Finally,   AGI.. so this is old idea and a borrowed idea from LL Thurstone (and Spearman who also had the idea prior but had no math or alg), who in 1930, defined different types of Human Intelligence including a type of "GENERAL Intelligence".
     This lead to IQ tests  in the 40s and 50s and frustrating attempts at finding it ... instead l finding "G" Thurstone invented Factor analysis-which turns out to be useful!   Its difficult enough to try and define human intelligence, without claiming some
 sort of "G" factor for AI.   With due respect to my friends at DeepMind... This seems like a deadend.</font></p>
<p><font size="+1">Cheers,</font></p>
<p><font size="+1">Steve<br>
</font></p>
<p><br>
</p>
<p><br>
</p>
<p>* a troll is a person who posts inflammatory, insincere, digressive, extraneous, or off-topic messages in an online community, with the intent of provoking readers into displaying emotional responses, or manipulating others' perception<br>
</p>
<div>On 6/9/22 4:33 PM, Gary Marcus wrote:<br>
</div>
<blockquote type="cite">
<div dir="ltr">Dear Dr. Hinton,</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">You very directly asked my side to produce some tangible goals. Ernest Davis and I did precisely what you asked, and in return you described me (in a separate but public message that also appears to have come from your account) as deranged.  There
 is no world in which that is socially acceptable, or a positive step towards science. </div>
<div dir="ltr"><br>
</div>
<div dir="ltr">Your reaction is particularly striking because it is a clear outlier. In general, despite the perfectly reasonable questions that you asked about wording in your subsequent email (which would presumably need be negotiated in any actually-implemented
 bet, as one moved from term sheet to contract), the community reaction has actually been quite favorable. LongNow offered to host it, Metaculus added to their forecast site, Christian Szegedy placed a side bet and ran a lengthy discussion about the math proposition,
 etc.  Your reactions are so far out of range with any of the other reaction that I have received than I am frankly concerned for your well-being.</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">§</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">All that said, you raised one substantive question, and I will address it. I am reasonably familiar with the PaLM model that you refer to, and aware of the claim that it “understands” jokes. I am also aware of the fact that what is provided in
 the paper was a numerator without a denominator.</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">There is no clarity about what was tried, or how general it was, or under what conditions it failed; subset is indeed the operative word. In no world would what was written pass traditional peer review. Even for a conference paper, what is reported
 about joke interpretation is woefully thin. It’s really not much rest to your theory on. </div>
<div dir="ltr"><br>
</div>
<div dir="ltr">I am also aware of the fact that your colleagues at Google failed to supply more detail when I requested it—never a good sign. </div>
<div dir="ltr"><br>
</div>
<div dir="ltr">How general is the ability? Is it a handful of paraphrases of jokes in vast memorized database? Would it extend to other kinds of jokes? Could it (or related models like Gato, with visual input) explain this cartoon?</div>
<div dir="ltr"><br>
</div>
<div dir="ltr"><img alt="image1.jpeg" src="cid:18158aae2ab43c689201"></div>
<div dir="ltr"><br>
</div>
<div dir="ltr">Or why this bit of dialog with GPT (prompt in bold) is inadvertently funny?</div>
<blockquote type="cite">
<div dir="ltr">
<p><b>Sally's cow died yesterday. When will the cow be alive again? Let's think step by step.</b></p>
<p>First, the cow must be buried. This takes a few hours.</p>
<p>Next, a new cow must be born. This takes nine months.</p>
<p>Therefore, the earliest the cow will be alive again is nine months from now.</p>
</div>
</blockquote>
<div dir="ltr">Probably not.  </div>
<div dir="ltr"><br>
</div>
<div dir="ltr">§</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">What we have known since Eliza is that humans are easily seduced into anthropomorphizing machines. I am going to stand by my claim that current AI lacks understanding: </div>
<div dir="ltr">
<ul>
<li>one cannot derive a set of logic propositions from a large language model</li><li>one cannot reliably update a world model based on an LLMs calculations (a point that LeCun has also made, in slightly different terms)</li><li>one cannot reliably reason from what and LLM derives, </li><li>LLMs themselves cannot reliably reason from they are told..</li></ul>
</div>
<div dir="ltr">My point is not a Searlean one about the impossibility of machines thinking, just a reality of the limits of contemporary systems. On the latter point,  I would also urge you to read my recent essay called “Horse rides Astronaut”, to see how
 easy it is make up incorrect rationalization about these models when they make errors. </div>
<div dir="ltr"><br>
</div>
<div dir="ltr">Inflated appraisals of their capabilities may serve some sort of political end, but will not serve science.</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">I cannot undo whatever slight some reviewer did to Yann decades ago, but I can call the current field as I see it; I don’t believe that current systems have gotten significantly  closer to what I described in that 2016 conversation that you quote
 from. I absolutely stand by the claim that we are a long way from answering “<span style="color:rgb(26,26,26);font-family:Spectral,serif,-apple-system,system-ui,"Segoe UI",Roboto,Helvetica,Arial,sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol"">the
 deeper questions in artificial intelligence, like how we understand language or how we reason about the world." SInce you are found of quoting stuff I right 6 or 7 years ago, here’s a challenge that I proposed in the New Yorker 2014; to me I see real progress
 on this sort of thing, thus far:</span></div>
<div dir="ltr"><span></span></div>
<blockquote type="cite">
<div dir="ltr"><span><br>
</span></div>
<div dir="ltr"><span style="font-family:TNYAdobeCaslonPro,"Times New Roman",Times,serif;background-color:rgb(255,255,255);font-size:20px"><i>allow me to propose a Turing Test
 for the twenty-first century: build a computer program that can watch any arbitrary TV program or YouTube video and answer questions about its content—“Why did Russia invade Crimea?” or “Why did Walter White consider taking a hit out on Jessie?” Chatterbots
 like Goostman can hold a short conversation about TV, but only by bluffing. (When asked what “Cheers” was about, it responded, “How should I know, I haven’t watched the show.”) But no existing program—not Watson, not Goostman, not Siri—can currently come close
 to doing what any bright, real teenager can do: watch an episode of “The Simpsons,” and tell us when to laugh.</i></span></div>
</blockquote>
<div dir="ltr"><span style="font-family:TNYAdobeCaslonPro,"Times New Roman",Times,serif;background-color:rgb(255,255,255);font-size:17px"><br>
</span></div>
<div dir="ltr"><span style="font-family:TNYAdobeCaslonPro,"Times New Roman",Times,serif;background-color:rgb(255,255,255);font-size:17px">Can Palm-E do that? I seriously doubt it. </span></div>
<div dir="ltr"><span> </span></div>
<div dir="ltr"><br>
</div>
<div dir="ltr">Dr. Gary Marcus</div>
<div dir="ltr"><br>
</div>
<div dir="ltr">Founder, Geometric Intelligence (acquired by Uber)</div>
<div dir="ltr">Author of 5 books, including Rebooting AI, one of Forbes 7 Must read books in AI, and The Algebraic Mind, one of the key early works advocating neurosymbolic AI</div>
<div dir="ltr"><br>
</div>
<div dir="ltr"><br>
</div>
<div dir="ltr"><br>
</div>
<div dir="ltr"><br>
</div>
<div dir="ltr"><br>
</div>
<div dir="ltr"><br>
<blockquote type="cite">On Jun 9, 2022, at 11:34, Geoffrey Hinton <a href="mailto:geoffrey.hinton@gmail.com" target="_blank">
<geoffrey.hinton@gmail.com></a> wrote:<br>
<br>
</blockquote>
</div>
<blockquote type="cite">
<div dir="ltr">
<div dir="ltr">I shouldn't respond because your main aim is to get attention without going to the trouble of building something that works (personal communication, Y. LeCun) but I cannot resist pointing out the following Marcus claim from 2016:
<div><span><br>
</span></div>
<div><span>"People are very
 excited about big data and what it's giving them right now, but I'm not sure it's taking us closer to the deeper questions in artificial intelligence, like how we understand language or how we reason about the world. "</span></div>
<div><font face="Spectral, serif, -apple-system, system-ui,
                Segoe UI, Roboto, Helvetica, Arial, sans-serif, Apple
                Color Emoji, Segoe UI Emoji, Segoe UI Symbol" color="#1a1a1a"><br>
</font></div>
<div><font face="Spectral, serif, -apple-system, system-ui,
                Segoe UI, Roboto, Helvetica, Arial, sans-serif, Apple
                Color Emoji, Segoe UI Emoji, Segoe UI Symbol" color="#1a1a1a">Given that big neural nets can now explain why
 a joke is funny (for some subset of jokes) do you still want to stick with this claim?  It seems to me that the reason you made this claim is because you have a strong prior belief about how language understanding and reasoning must work and this belief is
 remarkably resistant to evidence.  Deep learning researchers have seen this before. Yann had a paper rejected by a vision conference even though it beat the state-of-the-art and one of the reasons given was that the  model learned everything and therefore
 taught us nothing about how to do vision.  That particular referee had a strong idea of how computer vision must work and failed to notice that the success of Yann's model showed that that prior belief was spectacularly wrong. </font></div>
<div><font face="Spectral, serif, -apple-system, system-ui,
                Segoe UI, Roboto, Helvetica, Arial, sans-serif, Apple
                Color Emoji, Segoe UI Emoji, Segoe UI Symbol" color="#1a1a1a"><br>
</font></div>
<div><font face="Spectral, serif, -apple-system, system-ui,
                Segoe UI, Roboto, Helvetica, Arial, sans-serif, Apple
                Color Emoji, Segoe UI Emoji, Segoe UI Symbol" color="#1a1a1a">Geoff</font></div>
<div><font face="Spectral, serif, -apple-system, system-ui,
                Segoe UI, Roboto, Helvetica, Arial, sans-serif, Apple
                Color Emoji, Segoe UI Emoji, Segoe UI Symbol" color="#1a1a1a"><br>
</font>
<div><br>
</div>
<div><br>
</div>
</div>
</div>
<br>
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">On Thu, Jun 9, 2022 at 3:41 AM Gary Marcus <<a href="mailto:gary.marcus@nyu.edu" target="_blank">gary.marcus@nyu.edu</a>> wrote:<br>
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div dir="auto">
<div dir="ltr">Dear Connectionists, and especially Geoff Hinton,
<div dir="ltr">
<div dir="ltr">
<div><br>
</div>
<div>It has come to my attention that Geoff Hinton is looking for challenging targets. In a just-released episode of The Robot Brains podcast [<a href="https://urldefense.com/v3/__https://www.youtube.com/watch?v=4Otcau-C_Yc__;!!BhJSzQqDqA!Xh3JO9ofzqekK6I5uDA0F9J35tYqCEKqe2VyJXZaTtWlhk_g0aLu79J2fMwGE1WT43F66Osn0VHJ10Uf2t-8BGjQUsDx$" target="_blank">https://www.youtube.com/watch?v=4Otcau-C_Yc</a>],
 he said 
<div><br>
</div>
<div><i>“If any of the people who say [deep learning] is hitting a wall would just write down a list of the things it’s not going to be able to do then five years later, we’d be able to show we’d done them.”</i></div>
<div><br>
</div>
<div>Now, as it so happens, I (with the help of Ernie Davis) did just write down exactly such a list of things, last weekm and indeed offered Elon Musk a $100,000 bet along similar lines.</div>
<div><br>
</div>
<div>Precise details are here, towards the end of the essay: </div>
<div><br>
</div>
<div><a href="https://urldefense.com/v3/__https://garymarcus.substack.com/p/dear-elon-musk-here-are-five-things?s=w__;!!BhJSzQqDqA!Xh3JO9ofzqekK6I5uDA0F9J35tYqCEKqe2VyJXZaTtWlhk_g0aLu79J2fMwGE1WT43F66Osn0VHJ10Uf2t-8BN37K60l$" target="_blank">https://garymarcus.substack.com/p/dear-elon-musk-here-are-five-things</a></div>
<div><br>
</div>
<div>Five are specific milestones, in video and text comprehension, cooking, math, etc; the sixth is the proviso that for an intelligence to be deemed “general” (which is what Musk was discussing in a remark that prompted my proposal), it would need to solve
 a majority of the problems. We can probably all agree that narrow AI for any single problem on its own might be less interesting.</div>
<div><br>
</div>
<div>Although there is no word yet from Elon, Kevin Kelly offered to host the bet at LongNow.Org, and Metaculus.com has transformed the bet into 6 questions that the community can comment on.  Vivek Wadhwa, cc’d, quickly offered to double the bet, and several
 others followed suit;  the bet to Elon (should he choose to take it) currently stands at $500,000.</div>
<div><br>
</div>
<div>If you’d like in on the bet, Geoff, please let me know. </div>
<div><br>
</div>
<div>More generally, I’d love to hear what the connectionists community thinks of six criteria I laid out (as well as the arguments at the top of the essay, as to why AGI might not be as imminent as Musk seems to think).</div>
<div><br>
</div>
<div>Cheers.</div>
<div>Gary Marcus</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
</div>
</blockquote>
</blockquote>
<div>-- <br>
<img src="cid:18158aae2ac61a917f32" border="0"></div>
</div>

</blockquote></div>